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(57) Abstract: The invention relates to a method for 
analysing nucleic acid chains. The basis for the method 
is the detection of the fluorescent signals of individual 
nucleotide molecules, labelled with dyes, which are in- 
corporated into growing nucleic acid chains by a poly- 
merase. The reaction takes place on a planar surface. 
A large number of individual nucleic acid molecules 
are immobilised on said surface. All these nucleic acid 
molecules are subjected to the same conditions, so that 
a synthesis reaction can take place simultaneously in all 
the nucleic acid molecules. 
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(57) Zusammenfassung: Die Erfindung betrifft 
ein Verfahren zur Analyse von Nukleinsaureketten. 
Grunellage der Methode ist die Detektion von 
FluoreszenzsignaJen einzelner, mit Farbstoffen 
markierter NukleotidmolekUle, die durch eine Poly- 
merase in wachsende Nukleinsaureketten eingebaut 
werden. Die Reaktion verlauft auf einer planen 
Oberfiache. Auf dieser Oberfiache sind viele einzelne 
NukleinsHure-Molektile immobilisiert. Alle diese 
Nukleinsaure-Molekiile sind gleichen Bedingungen 
ausgesetzt, so dass an alien Nukleinsiiure-MolekUlen 
gleichzeitig eine Aufbaureaktion ablaufen kann. 
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Verfahren zur Analyse von Nukleinsaureketten 



Die Erfindung betrifft ein Verfahren zur Analyse von 
Nukleinsaureketten, Die Grundlage der Methode ist die Detection 
von Fluoreszenzsignalen einzelner mit Farbstoffen markierter 
Nukleotidmolekiile, die durch eine Polymerase in eine wachsende 
Nukleins&urekette eingebaut werden. Die Reaktion verl&uft auf 
einer planen OberflSche. An diese Oberflache sind viele 
einzelne Nukleinsaure-Molektile gebunden. Alle diese 
Nukleins&ure-Molektile sind gleichen Bedingungen ausgesetzt, so 
dass an alien Nukleins&ure-Molekulen gleichzeitig eine 
Aufbaureaktion ablaufen kann. 
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Das Verfahren umfafit im wesentlichen folgende Schritte: 

1) Bindung der Nukleinseiureketten (NSKFs) auf einer planen 
Oberflache rait anschlieSender Hybridisierung von Primern, 

5 alternativ Bindung von Primern mit anschlieSender 
Hybridisierung von NSKFs, so dass NSKF- Primer -Komplexe 
gebildet werden. 

2) Durchffihren einer zyklischen Aufbaureaktion, wobei jeder 
Zyklus aus folgenden Schritten besteht: 

10 a) Zugabe einer L6sung mit markierten Nukleotiden (NTs*) 

und Polymerase zu den gebundenen NSKF-Primer- 
Komplexen, 

b) Inkubation der gebundenen NSKF- Primer- Komplexe mit 
dieser Losung unter Bedingungen, die zur VerlSngerung 

15 der komplement&ren Str&nge urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen Molekulen, 

e) Entfernung der Markierung von den eingebauten 
Nukleotiden, 

20 f) Waschen. 

Gegebenenfalls erfolgen mehrfache Wiederholungen des 
Zyklus . 

3) Analyse der detektierten Signale der einzelnen Molekttle. 

4) Rekonstruktion der Sequenzen aus den Einzeldaten. 

25 

1^ Abkurzunaen und Bearif f seriauteruncren 

DNA - DesoxyribonukleinsSure verschiedenen Ursprungs und unter- 
30 schiedlicher L&nge (genomische DNA, cDNA, ssDNA, dsDNA) 



RNA - RibonukleinsSure (meist mRNA) 



Polymerasen - Enzyme, die komplementare Nukleotide in einen 
35 wachsenden DNA- oder RNA-Strang einbauen kdnnen ( z.B. DNA- 
Polymerasen, Reverse-Transkriptasen, RNA- Polymerasen) 

dNTP - 2'-deoxi-Nucleosid-Triphosphate, Substrate fflr DNA- 
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Polymerasen und Reverse -Transkriptasen 

NTP - Nukleos id- Triphosphate, Substrate fttr RNA-Polymerasen 

5 NT - natOrliches Nukleotid, meist dNTP, wenn nicht ausdriicklich 
anders gekennzeichnet . 

Abkurzung "NT" wird auch bei der L&ngenangabe einer Nukleinsau- 
resequenz verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" 
10 fiir Nukleosid-Monophosphate. 

Im Text wird bei Abkurzungen die Mehrzahl durch Verwendung des 
Suffixes »s» gebildet, "NT" steht zum Beispiel ftir 

"Nukleotid" , "NTs" steht f\ir mehrere Nukleotide. 

15 

NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdriick- 
lich anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleo- 
tide 

20 NSK - Nukleins&urekette. DNA oder RNA in ihrer ursprunglichen 
Lange 

NSKF - Nukleinsaurekettenf ragment (DNA oder RNA) , das einem 
Teil der Gesamtsequenz entspricht, NSKFs 

25 Nukleinsaurekettenf ragmente . Die Summe der NSKFs bildet ein 
Equivalent zur Gesamtsequenz. Die NSKFs k6nnen beispielsweise 
Fragmente von DNA- oder RNA-Gesamtsequenz sein, die nach einem 
Fragment ierungsschritt entstehen. 

30 Gesamtsequenz - die in der Sequenzierungsreaktion eingesetzte 
Sequenz oder die eingesetzten Sequenzen, meistens in NSKFs 
tiberffihrt. Sie kann ursprunglich aus einer oder mehreren NSKs 
bestehen. Dabei kann die Gesamtsequenz Teile oder Aquivalente 
einer anderen Sequenz oder von Sequenz -Populationen darstellen 

35 (z.B. mRNA, cDNA, Plasmid-DNA mit Insert, BAC, YAC) und aus 
einer oder unterschiedlichen Spezies stammen. 

■ 

Primerbindungstelle (PBS) - Teil der Sequenz in der NSK oder 
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NSKF, an den der Primer bindet. 

Referenzsequenz - eine bereits bekannte Sequenz, zu der die 
Abweichungen in der zu untersuchenden Sequenz bzw. in den zu 
5 untersuchenden Sequenzen (Gesamtsequenz) ermittelt werden. Als 
Referenzsequenzen kdnnen in Datenbanken zug&ngliche Sequenzen 
verwendet werden, wie z.B. aus der NCBI-Datenbank. 

Tm - Schmelz temper a tur 

10 

Plane Oberfl&che: Oberfiache, die vorzugsweise folgende 
Merkmale aufweist: l) sie erlaubt, mehrere einzelne Molekule, 
vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem 
jeweiligen gegebenen Objektiv-Oberf lSche-Abstand bei einer 
15 Objektivposition gleichzeitig zu detektieren. 2) Die 
immobilisierten einzelnen Molekule befinden sich in derselben 
Fokusebene, die reproduzierbar eingestellt werden kann. 

Weitfeld-Optik-Detektionssystem - Detekt ions system, das 
20 gleichzeitig Fluoreszenzsignale von einzelnen, auf einer 
Flache verteilten Molekiilen detektieren kann, wobei die Flache 
ca. 100 fim 2 und grSSer ist. Ein Beispiel fur Weitfeld- 
Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 oder 
Axioplan 2e (Zeiss) mit einem Planneof luar-Objektiv lOOx NA 
25 1,4 Olimmersion (Zeiss), oder einem Planapochromat-Objektiv 
lOOx NA 1.4 Olimmersion (Zeiss); die Anregung der Fluoreszenz 
kann dabei mit einer Lampe, z.B. Quecksilberdampf lampe, oder 
einem Laser oder Dioden erfolgen. Sowohl Epif luoreszenzmdus 
als auch im Totalref lexions-Fluoreszenzmikroskopie -Modus 
30 (total internal reflection fluorescence microscopy, TTRF- 
Microscopy) oder Laser-Scanning-Mikroskopie-Modus k6nnen 
verwendet werden. In dieser Anmeldung wird Gebrauch von dieser 
Weitfeld-Detektionsoptik gemacht 

35 

Sterisches Hindernis: Sterisch anspruchs voile Gruppe, die durch 
ihre chemische Struktur die Eigenschaften der mit dieser Gruppe 
gekoppelten NTs* so verftndert, dass diese durch eine Polymerase 
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in einer Extensionsreaktion nicht nacheinander eingebaut werden 
kdnnen . 

Definition der Termination: Als Termination wird in dieser An- 
5 meldung der reversible Stop des Einbaus der modif izierten unge- 
spalteten NTs* bezeichnet. 

Dieser Begriff ist von dem Qblichen Gebrauch des Wortes "Termi- 
nation" durch Dideoxy-NTP bei einer konventionellen 
Sequenzierung zu trennen. 

10 

Die Termination kommt nach dem Einbau eines modifizierten NT* 
zustande. Das modif izierte eingebaute NT* trSgt eine an die Base 
reversibel gekoppelte sterische Gruppe, die zur Behinderung des 
Einbaus eines n&chsten komplement&ren NT* in den wachsenden 
15 Strang durch eine Polymerase fuhrt. 

Genprodukte - Bei den Genprodukten handelt es sich urn die 
primaren Genprodukte der Gene. Im wesentlichen handelt es sich 
dabei urn RNA-Transkripte der genannten Gene, welche auch als 
20 Target -Sequenzen (oder Target -Nukleinsturesequenzen) bezeichnet 
werden. Diese Target -Sequenzen schlieSen neben mRNA auch davon 
abgeleitete einzelstrftngige und doppelstrangige cDNA, von cDNA 
abgeleitete RNA oder von cDNA amplif izierte DNA ein. 

25 Einzelnukleotidpolymorphismen (single nucleotide 

polymorphisms, SNPs) - Ver&nderungen in den Sequenzen, die als 
Substitution (Transition oder Transversion) oder als Deletion 
oder Insertion einzelner NT auftreten k6nnen. 

30 

2uu Stand de r Technik 

Die Nukleins&urenketten-Sequenzanalyse ist in vielen Bereichen 
der Wissenschaft, Medizin vmd Industrie zu einem wichtigen 
35 Werkzeug geworden. Zur Analyse wurden mehrere Verfahren 
entwickelt . 

Die bekanntesten Verfahren sind die Ketten-Terminations-Sequen- 
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zierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 5463), 
die auf dem Einbau von Kettenterminatoren basiert, und die 
Maxam-Gilbert-Methode, die auf Basen-spezif ischer Modifikation 
und Spaltung von Nukleinsaureketten beruht (A.M. Maxam and W. 
5 Gilbert PNAS 1977, v. 74 S.560) . Beide Methoden liefern eine 
Anzahl von Nukleins&urekettenf ragmenten verschiedener Langen. 
Diese Fragmente werden der Lange nach in einem Gel aufgetrennt. 
Dabei mCissen alle Nachteile der Elektrophorese (wie z.B. lange 
Laufzeit, relativ kurze Strecken von Sequenzen, die in einem 
10 Ansatz bestimmt werden konnen, begrenzte Anzahl der parallelen 
Ansatze sowie relativ grofie Mengen an DNA) in Kauf genommen 
werden. Diese Methoden sind sehr arbeitsintensiv und langsam. 

Ein weiteres Verf ahren . zur Sequenzierung basiert auf der Hybri- 
15 disierung von Nukleinsaureketten mit kurzen Oligonukleotiden. 
Dabei wird mit mathematischen Methoden berechnet, wie viele 
Oligonukleotide einer bestimmten Lange vorhanden sein miissen, 
urn eine kotnplette Sequenz zu ermitteln (Z.T. Strezoska et al. 
PNAS 1991 v.88 S. 10089, R.S.Drmanac et al. Science 1993 v. 260 
20 S.1649). Auch dieses Verf ahren ist mit Problemen behaftet: Es 
kann nur eine Sequenz in einem Ansatz bestimmt werden, sekun- 
dare Strukturen storen die Hybridisierung und Sequenzwiederho- 
lungen verhindem die korrekte Analyse. 

25 Eine andere Mdglichkeit zur Sequenzierung haben Arbeitsgruppen 
beispielsweise von (Dower US Patent 5.547.839, Canard et al. US 
Patent 5.798.210, Rasolonj atovo Nucleosides & Nucleotides 1999, 
v.18 S.1021, Metzker et al. NAR 1994, v. 22, S.4259, Welch et 
al. Nucleosides & Nucleotides 1999, v. 18, S.197) entwickelt. 

30 Diese Methode wird abgekOrzt als BASS (Base Addition Sequencing 
Scheme) oder SBS (Sequecing by Synthesis) bezeichnet. Dabei 
wird eine grofie Anzahl gleicher einzelstr3ngiger DNA-Stttcke an 
einem definierten Ort auf einer Oberfiache fixiert und das 
Signal von der Gesamtheit dieser vielen identischen DNA-Stttcke 

35 analysiert. Zu dieser fixierten DNA wird eine L6sung mit 
Polymerase und Nukleotiden zugegeben, so dass ein 
komplementarer Strang synthetisiert werden kann. Dabei soil die 
Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein 
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einziges NUkleotid eingebaut. Dieses wird detektiert, worauf 
die Polymerase in einem n&chsten Zyklus das n&chste Nukleotid 
einbaut. Bei dieser Methode wurden an der 3 1 -OH-Gruppe der 
Deoxyribose modif izierte Nukeotide verwendet. 
5 Trotz des Gelingens einiger einzelner Schritte der Methode 
wurde sie nicht zu einem funktionsfShigen Verfahren 
entwickelt. Dies kann beispielsweise auf folgenden Tatsachen 
beruhen: Beim Aufbau der komplementaren Strange tritt sehr 
schnell eine Desynchronisation der Synthese auf, so dass bei 

10 jedem Schritt die Fehler akkumulieren. Deshalb kdnnen nur sehr 
kurze Fragmente sequenziert werden. Es ist zu betonen, dass 
alle beschriebenen BASS-Methoden nicht auf der Detektion von 
einzelnen Molekulen beruhen. Das Signal wird stattdessen von 
einer grofcen Anzahl identischer an einem definierten Ort 

15 immobilisierter Molekule registriert. Die in diesen Methoden 
ubliche Verwendung der Begriffe "einzelne Molekule" und 
"MolekQle" zielt dabei nicht auf individuelle, voneinander ge- 
trennte Molekule, sondern auf eine Population, die aus vielen 
identischen Molekulen besteht. Identisch heifit in diesem Fall, 

20 dass die Molekule die gleiche Sequenz haben. 

Ein weiteres Problem stellen die an 3 "-Position modif izierten 
Nukleotide dar. Einerseits fuhrt die Ankopplung groSer 
Substituenten an diese Position der Nukleotide in vielen Fallen 
zur Stoning der Einbaureaktion durch die Polymerasen. 

25 Andererseits sind Polymerasen im Stande, einige Modif ikationen 
von der 3 "-Position abzuspalten. 

Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein 
Verfahren zur Sequenzanalyee von Nukleinsaureketten 

30 bereitzustellen, das die Nachteile der oben erwahnten Methoden 
nicht aufweist und vor allem eine billigere, schnellere vmd 
effizientere Analyse von Nukleins&uresequenzen ermdglicht. 
Insbesondere soli das Verfahren in der Lage sein, viele 
Sequenzen parallel zu bestimmen. Es kann dann beispielsweise 

35 f\ir die Analyse sehr langer Nukleinsaureketten (mehrere Mb) 
oder f\ir die Variantenalyse an vielen kurzen Ketten 
(Mutationsanalyse, SNP-Analyse) in einem Ansatz verwendet 
werden . 
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3.1. Kurze Be schreibung 

5 Die Aufgabe wird erf indungsgem&fi durch ein Verfahren zur 
parallelen Sequenzanalyse von Nukleins&uresequenzen (Nu- 
kleins&ureketten, NSKs) gelost, bei dem man 

Fragmente (NSKFs) einzelstr&ngiger NSKs mit einer L&nge von 
10 etwa 50 bis 1000 Nukleotiden erzeugt, die fiberlappende 
Teilsequenzen der Gesamtsequenzen darstellen, man 

die NSKFs unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlicher Primer in Form von NSKF-Primer- 
15 Komplexen auf einer Reaktionsoberf l&che in einer zuf&lligen 
Anordnung bindet, mem 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
20 durchfuhrt, indem man 

a) zu den an die Oberflache gebundenen NSKF-Primer- 
Komplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 

25 (NTs*) enthalt, die mit Fluoreszenzf arbstof fen markiert 

sind, wobei die bei gleichzeitiger Verwendung von 
mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstoffe so gew&hlt sind, dass sich die 
verwendeten NTs* durch Messung unterschiedlicher Fluo- 

30 reszenzsignale voneinander unterscheiden lassen, wobei 

die NTs* strukturell an der Base so modifiziert sind, 
dass die Polymerase nach Einbau eines solchen NT* in 
einen wachsenden komplementaren Strang nicht in der 
Lage ist, ein weiteres NT* in denselben Strang ein- 

35 zubauen, wobei der Fluoreszenzfarbstof f abspaltbar ist 

und die strukturelle Modifikation ein abspaltbarer 
sterisch anspruchsvoller Ligand ist, man 



30 
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b) die in Stufe a) erhaltene station&re Phase unter 
Bedingungen inkubiert, die zur VerlSngerung der kom- 
plementaren Strange geeignet sind, wobei die 

5 komplementaren Strange jeweils um ein NT* verl&ngert 

werden, man 

c) die in Stufe b) erhaltene station&re Phase unter 
Bedingungen w&scht, die zur Entfernung nicht in einen 

10 komplementaren Strang eingebauter NTs* geeignet sind, 

man 

d) die einzelnen, in komplement&re Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 

!5 reszenzfarbstof f charakteristischen Signals detek- 

tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflSche bestimmt, man 

20 e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo- 

reszenzfarbstof fe und die sterisch anspruchsvollen 
Liganden von den am komplementaren Strang angefugten 
NTs* abspaltet, man 



25 f) die in Stufe e) erhaltene stationare Phase unter 

Bedingungen wafccht, die zur Entfernung der Fluo- 
reszenzfarbstof fe und der Liganden geeignet sind f man 



die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 



wobei man die relative Position einzelner NSKF-Primer-Komplexe 
auf der Reaktionsoberf lache und die Sequenz dieser NSKFs durch 
spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden 
Zyklen an den jeweiligen Positionen detektierten Fluores- 
35 zenzsignale zu den NTs bestimmt. 



Aus den ermittelten Teilsequenzen kann man beispielsweie die 
Gesamtsequenz der NSKs bestimmen. Utiter einer parallelen 
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Sequenzanalyse wird in diesem Zusammenhang die gleichzeitige 
Sequenzanalyse vieler NSKFs verstanden (beispielsweise 
1.000.000 bis 10.000.000), wobei diese NSKFs von einer 
einheit lichen NSK- Population oder von mehreren 
5 unterschiedlichen NSK-Populationen abgeleitet sind. 

Die erhaltene Population von tiberlappenden Teilsequenzen laSt 
sich beispielsweise bei de novo Sequenzierung mit kommerziell 
erh&ltlichen Programmen zur Gesamtsequenz der NSK zusammenfilgen 
10 (Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 
v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, Miller et al. 
J.Comput.Biol. 1994 v.l S.257) . 



Bei der Analyse von Varianten einer bekannten Referenzsequenz 
15 lassen sich Mutationen oder Einzelnukleotidpolymorphismen durch 
einen Vergleich der erhaltenen tiberlappenden Teilsequenzen mit 
der Referenzsequenz feststellen. 

Gemafi einer besonderen Ausfxihrungsform der Erfindung kann das 
20 Verfahren durchgeftihrt werden, indem man die Stufen a) bis f ) 
der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man 



a) in jedem Zyklus nur jeweils ein markiertes NT*, 

b) in jedem Zyklus jeweils zwei unterschiedlich markierte 
25 NTs* oder 

c) in jedem Zyklus jeweils vier unterschiedlich markierte 
NTs* 



einsetzt . 

30 

Wenn die NSKs Varianten einer bekannten Referenzsequenz sind 
kann das Verfahren auch durchgeftihrt werden, indem man die 
Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei 
35 unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt 
und man die Gesamtsequenzen durch Vergleich mit der 
Referenzsequenz ermittelt . 



WO 02/088382 



PCT/EP02/04659 



- 11 - 

Gegenstand der vorliegenden Erfindung sind ferner die in den 
Figuren 7e, 7f und 7g dargestellten Nukleotide und die ent- 
sprechenden markierten Nukleotide, die beispielsweise an die 
terminale Aminofunktion angeheftete Fluoreszenzfarbstof f e 
5 aufweisen, oder die in den Figuren 7h, 7i oder 7j dargestellten 
markierten Nukleotide. 

Gegenstand der vorliegenden Erfindung ist ferner die Verwendung 
der in Figuren 7e,7f und 7g dargestellten Nukleotide und der 
10 entsprechenden mit einem Fluoreszenzfarbstof f markierten 
Nukleotide far das erf indungsgem&Sen Verfahren. 

Gegenstand der vorliegenden Erfindung ist ferner die Verwendung 
der an der Base modif izierten NT*s (Beispiele siehe Figuren 
15 7k, 7L und 7m) und der entsprechenden mit einem 
Fluoreszenzfarbstoff markierten Nukleotide fxlr das 
er f indungsgemcLfie Ver f ahren . 

Gegenstand der Erfindung ist ferner ein Kit zur Durchfuhrung 
20 des Verfahrens das eine Reaktionsoberf lache, zur Durchfuhrung 
des Verfahrens er f order liche . Reaktionsldsungen, eine oder 
mehrere Polymerasen, und Nukleotide (NTs) enthalt, von denen 
ein bis vier mit Fluoreszenzfarbstof fen markiert sind, wobei 
die NTs ferner strukturell so modif iziert sind (NT* bzw. NTs*), 
25 dass die Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementSren Strang nicht in der Lage ist, ein 
weiteres NT* in denselben Strang einzubauen, wobei der Fluores- 
zenzfarbstoff abspaltbar ist und die strukturelle Modifikation 
ein abspaltbarer sterisch anspruchsvoller Ligand ist. Bei den 
30 Nukleotiden handelt es sich vorzugsweise urn die oben genannten 
erfindungsgem&Sen Nukleotide, 

GemaS einer besonderen Ausfuhrungsform der Erfindung enth&lt 
das Kit ferner zur Erzeugung von EinzelstrSngen aus 
35 Doppelstrangen erforderliche Reagenzien, einzelstr&ngige 
Nukleins&uremolekiile, die als PBS in die NSKFs eingefiihrt 
werden, Oligonukleotid-Primer, zur Abspaltxuig der Fluores- 
zenzfarbstof fe und sterisch anspruchsvollen Liganden 
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erforderliche Reagenzien und/oder Waschl6sungen. 

Die erfindungsgemase Methode dient zur Ermittlung der 
5 Nukleinsauresequenzen und kann in verschiedenen Bereichen der 
Genet ik eingesetzt werden. Dazu zahlen insbesondere die 
Bestimmung unbekannter, langer Sequenzen, Analysen von Sequenz- 
Polymorphismen und Punktmutationen sowie die parallele Analyse 
einer groSen Zahl an Gensequenzen. 

10 

Die Vorbereitung des zu analysierenden Materials (einzel- und 
doppelstrangige Nukleinsauresequenzen) hangt von der 
Aufgabenstellung ab und hat das Ziel, aus einer langen Nuklein- 
saurekette eine Population an relativ kleinen, einzelstrangigen 
15 Nvikleinsaurekettenfragmenten (NSKFs) zu bilden, diese Fragmente 
mit einem fur den Start der Sequenzierungsreaktion geeigneten 
Primer zu versehen (NSKF-Primer-Kotnplexe) und auf einer planen 
Oberfl&che zu fixieren. 

20 Dabei werden einzelne NSKFs auf einer planen Oberflache in 
einer solchen Weise fixiert, dass eine enzymatische Reaktion an 
diesen Molekiilen ablaufen kann. Prinzipiell sind verschiedene 
Arten der Immobilisation mdglich, die von der Zielsetzung, der 
Art der NSK und der fiir die Reaktion eingesetzten Polymerase 

25 abhangen. Die NSKFs werden bei der Immobilisierung bzw. Bindung 
zufSllig auf der Oberflache verteilt, d,h. es muE also nicht 
auf eine exakte Positionierung der einzelnen Ketten geachtet 
werden. NSKF-Primer-Komplexe konnen <iber die NSKFs oder Primer 
an die Oberflache gebunden werden. Die NSKF-Primer-Komplexe 

30 mussen dabei in einer solchen Dichte auf der Oberflache fixiert 
werden, dass eine eindeutige Zuordnung der spater detektierten 
Signale von den eingebauten NT*s zu einzelnen NSKFs 
gewahrleistet ist. 

35 Nach der Vorbereitung der NSKFs startet man mit alien auf der 
Oberflache immobilisierten NSKF-Primer-Komplex-Molek\ilen die 
Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient 
die Synthese des komplementaren Stranges zu jedem einzelnen 
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gebundenen NSKF. Dabei werden in den neu synthetisierten Strang 
markierte NTs* eingebaut. Die Polymerase baut nur ein einziges 
markiertes NT* in die wachsende Kette ein. Dies wird durch die 
reversible Ankopplung einer zur Termination ftihrenden, sterisch 
5 anspruchsvollen Gruppe an die NTs* erreicht. Der Binbau eines 
weiteren markierten NT* wird dadurch unmoglich gemacht. Diese 
sterisch anspruchs voile Gruppe ist vorzugsweise ein 
Pluoreszenzf arbstof f . 

10 Die Sequenzierungsreaktion verlauf t in mehreren Zyklen. Ein 
Zyklus umfasst folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu den gebundenen NSKF-Primer-Komplexen, 
15 b) Inkubation der gebundenen NSKF-Primer-Komplexe mit dieser 
L6sung unter Bedingungen, die zur Verlangerung der kom- 
plementaren Strange urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen Molekiilen, 

4 

20 e) Entfernung der Markierung von den eingebauten Nukleotiden, 
f) Waschen, 

Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus 
<a-f). 

25 

Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus wer- 
den so gewahlt, dass die Polymerasen an mehr als 50% der an der 
Sequenzierungsreaktion beteiligten NSKFs < ext ens ions fahige 
NSKF-Primer-Komplexe) in einem Zyklus ein markiertes NT* 
30 einbauen kdnnen, vorzugsweise an mehr als 90%. 

Die Anzahl der durchzufflhrenden Zyklen hangt dabei von der je- 
weiligen Aufgabenstellung ab, ist theoretisch nicht beschrSnkt 
und liegt vorzugsweise zwischen 20 und 5000. 

35 

Danach wird fur jedes fixierte NSKF seine spezifische Sequenz 
aus der Reihenfolge der eingebauten NTs* ermittelt. 
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Aus den Ciberlappenden NSKF-Sequenzen kann in einer 
Aus fflhrungs form die ursprtogliche NSK-Sequenz rekonstruiert 
werden ("Automated DNA sequencing and analysis" S. 231 ff . 1994 
M. Adams et al. Academic Press , Huang et al. Genom Res. 1999 
5 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. NAR 
1995 v.23 S.4992, Miller et al. J . Comput . Biol . 1994 v.l S.257) . 
Dabei sucht man in der gesamten Population von NSKF-Sequenzen 
nach Obereinstimmungen/Oberlappungen in den Sequenzen von 
NSKFs. Durch diese t)bereinstimmungen/t)berlappungen kann man die 
10 NSKF in eine Reihe bringen, z.B.: 

ACTGTGCGTCCGTATGATGGTCATTCCATG 

CATTCCATGGTACGTTAGCTCCTAG 

TCCTAGTAAAATCGTACC . 

15 

In der Praxis hat sich bei einer Sequenzierung von unbekannten 
Sequenzen bewahrt, eine Lange der sequenzierten Stiicke von mehr 
als 300 bp zu erreichen. Das erlaubt die Sequenzierung von 
Genomen aus Eukaryonten im Schrotschuss-Verfahren. 

20 

Dabei k&nnen die Fehler der Methode mit verschiedenen Mitteln 
erf ass t und korrigiert werden. S&mtliche Schritte des 
Verfahrens kdnnen weitgehend automatisiert werden. 

25 Durch die Arbeit mit einzelnen Molekulen ergeben sich mehrere 
Vorteile gegenuber der friiher beschriebenen BASS-Methode: 

1. Da die Molekule einzeln detektiert werden, besteht keine 
Gefahr, dass das Signal durch die Desynchronisation in der 

30 Population fehlerhaft wird. Fflr jedes fixierte NSKF wird 
eine eigene Sequenz erstellt. Daher spielt es keine Rolle, 
ob an einem benachbarten Molekfil die Synthese bereits 
weiter fortgeschritten oder zuriickgeblieben ist. 

2. Es ist nicht notwendig, Molekttle in einer definierten 
35 Anordnung auf der OberflSche zu fixieren, da das Signal von 

einzelnen Molekttlen ausgeht und nicht von einer r&umlich 
definierten Population (was bei BASS-Methoden notwendig 
ist) . 
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Detaillierte Bear hreibuncr 
4.1 Allgemeine Prinzipien der Reaktion 

5 

Im folgenden sollen anhand der Sequenzierung eines mehrere Mb 
langen DNA-Stuckes beispielhaft die allgemeinen Prinzipien der 
Reaktion dargestellt werden (Fig. 1) . Der Sequenzierung und der 
Rekonstruktion von NukleinsSurensequenzen liegt das Shotgun- 

10 Prinzip zugrunde ("Automated DNA sequencing and analysis 11 S. 
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom 
Res. 1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et 
al, NAR 1995 v. 23 S.4992, Miller et al. J. Comput .Biol . 1994 v.l 
S.257) . Die Sequenz eines langen DNA- Stacks wird dabei durch 

15 die Sequenzierung kleiner DNA-Fragmente und nachf olgender 
Rekonstruktion ermittelt. Das zu analysierende Material (1) 
wird fUr die SequenzierungBreaktion vorbereitet, indem es in 
Fragmente von vorzugsweise 50 bis 1000 bp Lange zerlegt wird 
(2) . Jedes Fragment wird anschlieSend mit einer 

20 Primerbindungsstelle und einem Primer versehen (3) . Dieses 
Gemisch aus verschiedenen DNA- Fragment en wird nun auf einer 
planen Oberflache fixiert (4) . Die nicht gebundenen DNA- 
Fragmente werden durch einen Waschschritt entfernt. Danach wird 
die Sequenzierungsreaktion an der gesamten Reaktionsoberf lache 

25 durchgef tihrt . Diese Reaktion verlauft zyklisch. Im 1. Schritt 
des Zyklus wird ein mit einem Fluoreszenzfarbstof f markiertes 
NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion 
so gesteuert, dass in jedem Zyklus jeweils nur ein markiertes 
NT* von einer Polymerase in den wachsenden Strang eingebaut 

30 werden kann. Das wird durch die Verwendung von NTs* erreicht, 
die eine reversibel gekoppelte, zur Termination fiihrende Gruppe 
tragen. Der Einbau eines weiteren markierten NT* wird dadurch 
unmdglich gemacht. Die Polymerase und die markierten NTs* werden 
gleichzeitig in die Reaktion eigesetzt (5) . Danach wird das 

35 Reaktionsgemisch entfernt und die Oberflache in geeigneter Art 
und Weise gewaschen (6) . Nun folgt ein Detektionsschritt (7) : 
Die Oberflache wird mit einer fair die Einzelmolekttldetektion 
geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, 
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Kamera, Scantisch, Computer mit Steuerungs- und Bilderkennungs- 
bzw. Bildverarbeitungssoftware) abgescannt und die Signale der 
einzelnen, eingebauten markierten NTs* identif iziert. Nach dem 
DetektionsBchritt wird die Markierung und die zur Termination 
5 fiihrende Gruppe von alien eingebauten NTs* entfernt (8) . Nach 
einem sich anschliefienden Waschschritt kann ein neuer Zyklus 
beginnen. Zur Rekonstruktion einer groSeren ursprunglichen 
DNA-Sequenz (z.B. mehrere Mb langes DNA-Stfick) sollen die DNA- 
Fragmente einige Hundert NT lang sein, falls man die 

10 Rekonstruktion nach dem Shotgun- Prinzip durchfiihrt ("Automated 
DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. 
Academic Press, Huang et al. Genom Res, 1999 v. 9 S.868, Huang 
Genomics 1996 v. 33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J . Comput . Biol . 1994 v.l S.257) . Da pro Zyklus nur 

15 jeweils ein markiertes NT* eingebaut wird, sind mindestens 300 
Zyklen zur Sequenzierung notwendig. 

4.2 Auswahl des Materials 

20 Mit Hilfe der erf indungsgemafcen Methode ist es mdglich, sowohl 
vorselektionierte DNA-Sequenzen (z.B. in YAC- , PAC-, oder BAC- 
Vektoren (R. Anand et al. NAR 1989 v. 17 S.3425, H. Shizuya et 
al. PNAS 1992 v.89 S.8794, "Construction of bacterial 
artificial chromosome libraries using the modified PAC system" 

25 in "Current Protocols in Human genetics" 1996 John Wiley & Sons 
Inc.) klonierte Abschnitte eines Genoms) als auch nicht vor- 
selektionierte DNA (z.B. genomische DNA, cDNA-Gemische) zu 
analysieren. Durch eine Vorselektion ist es moglich, im Vorfeld 
relevante Informationen, . wie z.B. Sequenz -Abschnitte aus einem 

30 Genom oder Populationen an Genprodukten, aus der groSe Menge 
genetischer Informationen herauszuf iltern und damit die Menge 
der zu analysierenden Sequenzen einzuschr&nken. 

4.3 Vorbereitung des Materials 

35 

Ziel der Materialvorbereitung ist es, gebundene einzelstr^ngige 
NSKFs mit einer LSnge von vorzugsweise 50-1000 NTs, einer 
einzelnen Primerbindungsstelle und einem hybridisierten Primer 
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(gebundene NSKF- Primer -Komplexe) zu erhalten. Diese NSKF- 
Primer-Komplexe haben beispielsweise die in Fig. 2 dargestellte 
Struktur. Im einzelnen k6nnen sehr variable Konstruktionen aus 
dieser allgemeinen Struktur abgeleitet werden. Zur Verbesserung 
5 der Anschaulichkeit folgen nun einige Beispiele, wobei die 
angeftihrten Methoden einzeln oder in Kombination eingesetzt 
werden k6nnen. 

4.3.1 Brzeugung kurzer NukleinsSurekettenf ragmente (50-1000 
10 NTs) ( Fragment ierungsschritt) 

Wichtig ist, dass die Fragmentierung der NSKs so erfolgt, dass 
Fragmente erhalten werden, die uberlappende Teilsequenzen der 
Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht f 
15 bei denen unterschiedlich lange Fragmente als Spaltprodukte in 
zufallsm&Eiger Verteilung entstehen. 

ErfindungsgemaS kann die Erzeugung der NukleinsSureketten- 
fragmente (NSKFs) durch mehrere Methoden er folgen, z.B. durch 

20 die Fragmentierung des Ausgangsmaterials mit Ultraschall oder 
durch Endonukleasen ("Molecular cloning" 1989 J.Sambrook et 
al. Cold Spring Harbor Laborotary Press), wie z.B. durch 
unspezif ische Endonukleasegemische . Erf indungsgem&£ wird die 
Ultraschall-Fragmentierung bevorzugt. Man kann die Bedingungen 

25 so einstellen, dass Fragmente mit einer durchschnittlichen 
LSnge von 100 bp bis 1 kb entstehen. Diese Fragmente werden an- 
schliefcend an ihren Enden durch das Kl enow -Fragment (E.coli- 
Polymerase I) oder durch die T4-DNA- Polymerase aufgefiillt 
("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor 

30 Laborotary Press) . 

* 

Ausserdem k6nnen aus einer langen NSK unter Verwendung randomi- 
sierter Primer komplementSre kurze NSKFs synthetisiert werden. 
Besonders bevorzugt wird diese Methode bei der Analyse der Gen- 
35 Sequenzen. Dabei werden an der mRNA einzelstrSngige DNA- 
Fragmente mit randomisierten Primern und einer reversen 
Transkriptase gebildet ( Zhang- J et al. Biochem.J. 1999 v. 337 
S.231, Ledbetter et al. J.Biol. Chem. 1994 v. 269 S. 31544, Kolls 
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et al. Anal.Biochem. 1993 v. 208 S.264, Decraene et al. 
Biotechniques 1999 v. 27 S.962). 

4.3.2 Einfiihrung einer Primerbindungsstelle in das NSKF. 

5 

Die Primerbindungsstelle (PBS) ist ein Sequenzabschnitt, der 
eine selektive Bindung des Primers an das NSKF ermoglichen 
soil. 

10 In einer Ausfdhrungsform konnen die Primerbindungsstellen 
unterschiedlich sein, so dass mehrere unterschiedlche Primer 
verwendet werden mtzssen. In diesem Fall konnen bestimmte 
Sequenzabschnitte der Gesamtsequez als naturliche PBSs fur 
spezifische Primer dienen. Diese Aus fiihrungs form ist besonders 

15 fiir die Untersuchung bereits bekannter SNP-Stellen geeignet, s. 
Beispiel 5 "SNP-Analyse mit sequenzspezif ischen Primern" . 

In einer anderen Ausffihrungsform ist es aus Grunden der 
Vereinfachung der Analyse gunstig, wenn eine einheitliche 
20 Primerbindungsstelle in alien NSKFs vorhanden ist. Gemafi einer 
bevorzugten Aus fuhrungs form der Erfindung werden die 
Primerbindungsstellen daher in die NSKFs extra eingefiihrt. Auf 
diese Weise kdnnen Primer mit einheitlicher Struktur fur die 
Reaktion eingesetzt werden. 

25 

Im folgenden wird diese Aus f\ihrungs form detailliert 
beschrieben. 

Die Zusammensetzung der Primerbindungsstelle ist nicht einge- 
30 schroinkt. Ihre Lange betragt vorzugsweise zwischen 20 und 50 
NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe zur 
Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann 
z.B. eine Biotingruppe sein. 

35 Als Beispiel fiir die Einftihrung einer einheitlichen 
Primerbindungsstelle werden im folgenden die Ligation und das 
Nukleotid-Tailing an DNA-Fragmente beschrieben. 
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a) Ligation: 

Dabei wird ein doppelstrSngiger Oligonukleotidkomplex mit einer 
Primerbindungsstelle verwendet (Fig. 3a). Dieser wird mit kom- 
merziell erhaitlichen Ligasen an die DNA-Fragmente ligiert 
5 ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor 
Laborotary Press) . Es ist wichtig, dass nur eine einzige 
Primerbindungsstelle an das DNA-Fragment ligiert wird. Das 
erreicht man z.B. durch eine Modifikation einer Seite des 
Oligonukleotidkomplexes an beiden Str&ngen (Fig. 3b) . Die 

10 Resultate nach der Ligation bzw. nach anschliefiender 
Denaturierung sind in Fig. 3c und 3d dargestellt. Die 
modifizierenden Gruppen am Oligonukleotidkompex konnen zur 
Immobilisation dienen. Die Synthese und die Modifikation eines 
solchen Oligonukleotidkomplexes kann nach standardisierten 

15 Vorschriften durchgeftihrt werden. Zur Synthese kann z.B. der 
DNA-Synthesizer 380 A Applied Biosystems verwendet werden. 
Oligonucleotide mit einer bestimmten Zusammensetzung mit oder 
ohne Modif ikationen sind aber auch als Auf tragssynthese 
kommerziell erhaltlich, z.B. von MWG-Biotech GmbH, Germany. 

20 

b) Nukleotid-Tailing: 

Statt der Ligation mit einem Oligonukleotid kann man mit einer 
terminalen Deoxynucleotidyl transferase mehrere (z.B. zwischen 
10 und 20) Nukleosid-monophosphate an das 3 ! -Ende eines ss-DNA- 

25 Fragments anknupfen ("Molecular cloning" 1989 J.Sambrook et al. 
Cold Spring Harbor Laborotary Press, "Method in Enzymology" 
1999 v. 303, S. 37-38) (Fig. 4), z.B. mehrere Guanosin- 
Monophosphate ( (G)n-Tailing genannt) . Das entstehende Fragment 
wird zur Bindung des Primers, in diesem Beispiel eines (On- 

30 Primers, verwendet. 

4.3.3 Einzelstrang-Vorbereitung 

FOr die Sequenzierungsreaktion werden einzelstr&ngige NSKFs 
35 ben6tigt. Falls das Ausgangsmaterial in doppelstrSngiger Form 
vorliegt, gibt es mehrere Mdglichkeiten, aus doppelstr&ngiger 
DNA eine einzelstrSngige Form zu erzeugen (z.B. Hitze- 
Denaturierung oder Alkali -Denaturierung) ("Molecular cloning" 
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1989 J.Sambrook et al. cold Spring Harbor Laborotary Press) . 
4.3.4 Primer fur die Sequenzierungsreaktion 

5 Dieser hat die Funktion, den Start an einer einzigen Stelle des 
NSKF zu erm6glichen, Er bindet an die Primerbindungsstelle im 
NSKF. Die Zusammensetzung und die LSnge des Primers sind nicht 
eingeschr&nkt. AuBer der Startfunktion kann der Primer auch 
andere Funktionen tibernehmen, wie z.B. eine Verbindung zur 
10 Reaktionsoberfl&che zu schaffen. Primer sollten so an die Lange 
und Zusammensetzung der Primerbindungsstelle angepafit werden, 
dass der Primer den Start der Sequenzierungsreaktion mit der 
jeweiligen Polymerase ermoglicht. 

15 Bei der Verwendung unterschiedlicher, beispielsweise naturlich 
in der ursprunglichen Gesamtsequenz vorkommender 
Primerbindungsstellen, werden die fur die jeweilige 
Primerbindungsstelle sequenzspezif ischen Primer verwendet. In 
diesem Fall wird fur die Sequenzierung ein Primergemisch 

20 eingesetzt. 

Bei einer einheitlichen, beispielsweise durch die Ligation an 
die NSKFs angekoppelten Primerbindungsstelle wird ein 
einheitlicher Primer verwendet. 

25 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann 
eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF 
dient, beispielsweise ist eine solche Funktionsgruppe eine 

30 Biotingruppe (s. Abschnitt Immobilisierung). Sie soli die 
Sequenzierung nicht storen. Die Synthese eines solchen Primers 
kann z.B. mit dem DNA- Synthesizer 380 A Applied Biosystems 
ausgefuhrt werden oder aber als Auf tragssynthese bei einem 
kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Germany erstellt 

35 werden) . 

Der Primer kann vor der Hybridisierung an die zu analysierenden 
NSKFs auf der Oberfl&che mit verschiedenen Techniken fixiert 



WO 02/088382 



PCT/EP02/04659 



- 21 - 

Oder direkt auf der Oberflache synthetisiert werden, 
beispielsweise nach (McGall et al. US Patent 5412087, Barrett 
et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton Publishing- 
5 "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor 
et al. Science 1991 v. 285 S.767, Timofeev et al. Nucleic Acid 
Research (NAR) 1996, v. 24 S.3142, Ghosh et al. NAR 1987 v/15 
S.5353, Gingeras et al. NAR 1987 v. 15 S.5373, Maskos et al. NAR 
1992 v.20 S.1679) . 

10 

Die Primer werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 bis 100 pro 100 pm 2 , 100 bis 10.000 pro 100 
fxm 2 oder 10.000 bis 1.000.000 pro lOOfim 2 gebunden, 

15 Der Primer oder das Primergemisch wird mit NSKFs unter Hybridi- 
sierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungsstelle des NSKF binden lassen. Diese Primer- 
Hybridisierung (Annealing) kann vor (1), wahrend (2) oder nach 
(3) der Bindung der NSKFs an die Oberflache erfolgen. Die 

20 Optimierung der Hybridisierungsbedingungen hangt von der 
genauen Struktur der Primerbindungsstelle und des Primers ab 
und ia&t sich nach Rychlik et al. NAR 1990 v. 18 S.6409 
berechnen. Im folgenden werden diese Hybridisierungsbedingungen 
als standardisierte Hybridisierungsbedingungen bezeichnet. 

25 

Falls eine fur alle NSKFs gemeinsame Primerbindungsstelle mit 
bekannter Struktur beispielsweise durch Ligation eigefuhrt 
wird, kdnnen Primer mit einheitlicher Struktur eingesetzt 
werden. Die Primerbindungsstelle kann an ihrem 3*-Ende eine 
30 funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. 
Beispielsweise ist diese Gruppe eine Biotin-Gruppe. Der Primer 
hat eine zur Primerbindungsstelle komplement&re Struktur. 

Bin Beispiel einer Primerbindungs telle und eines Primers ist 
35 nachfolgend dargestellt. 

5 • TAATACGACTCACTATAGG3 1 Primer ( T7 - 1 9 - Primer ) 
Biotin-3 ' ATTATGCTGAGTGATATCC5 ' Primerbindungsstelle 
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4.3.5 Fixierung von NSKF-Primer-Komplexe an die Oberfl&che 
(Bindung bzw. Immobilisierung von NSKFs) . 



5 Ziel der Fixierung (Immobilisierung) ist es, NSKF-Primer^ v 
Komplexe auf einer geeigneten planen Oberflache in einer Art 
und Weise zu fixieren, dass eine zyklische enzymatische 
Sequenzierungsreaktion ablaufen kann. Dies kann beispielsweise 
durch Bindung des Primers ( s . o . ) oder des NSKF an die 
10 Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Fixierung von NSKF-Primer- 
Komplexen kann variabel sein: 

1) Die NSKF-Primer-Komplexe konnen zunachst in einer Ldsung 
15 durch Hybridisierung (Annealing) gebildet und 

anschlieBend an die Oberflache gebunden werden. 

2) Primer konnen zunachst auf einer Oberflache gebunden 
werden und NSKFs anschlieSend an die gebundenen Primer 
hybridisiert werden, wobei NSKF-Primer-Komplexe entstehen 

20 (NSKFs indirekt an die Oberflache gebunden) 

3) Die NSKFs k6nnen zunachst an die Oberflache gebunden 
werden (NSKFs direkt an die Oberflache gebunden) und im 
anschlieSenden Schritt die Primer an die gebundenen NSKFs 
hybridisiert werden, wobei NSKF-Primer-Komplexe enstehen. 

25 Die Immobilisierung der NSKFs an die Oberflache kann daher 
durch direkte oder indirekte Bindung erfolgen. 

Oberflache und Reaktionsoberf ISche sind vorliegend als 
gleichwertige Begriffe aufzufassen, aufcer wenn explizit auf 

30 eine andere Bedeutung hingewiesen wird. Als Reaktionsoberf lciche 
dient die Oberflache einer festen Phase eines beliebigen 
Materials. Dieses Material ist vorzugsweise enzymatischen 
Reaktionen gegentiber inert und verursacht keine Storungen der 
Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. 

35 Polycarbonate oder Polystyrole) , Metall (Gold, Silber, oder 
Alluminium) oder beliebiges anderes Material, das diesen 
funktionellen Anforderungen gentlgt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 
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ist mit einer Verzerrung der Signale bei der wiederholten 
Detektion zu rechnen. 



Falls eine gelartige feste Phase (Oberflache eines Gels) 
5 verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fttr Molektile 
mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% 
Polyacrylamid Gel verwendet werden) . Eine solche Geloberf l&che 

10 hat anderen festen Oberfiachen gegenOber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 
an die Oberflache kommt. Durch die Bindung der NSKF-Primer- 
Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale von 

15 freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht immobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt 
(Fig. 5a) , Diese feste Unterlage kann Silicon, Glas, Keramik, 
Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall (Gold, 

20 Silber, oder Alluminium) oder beliebiges anderes Material sein. 
Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 mm. 
Die Geldicke ist vorzugsweise grdfier als die einfache 
Tiefensch&rfe des Objektivs sein, damit unspezif isch an die 
feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen 

25 und damit detektiert werden. Wenn die Tiefenscharf e z.B. 0,3 pm 
betragt, so liegt die Geldicke vorzugsweise zwischen 1 pm und 
100 pm. Die Oberflache kann als eine kontinuierliche Oberflache 
oder als diskontinuierliche, aus einzelnen kleinen 
Bestandteilen (z.B. Agarose -KCigelchen) zusammengesetzte Ober- 

30 flache hergestellt werden (Fig. 5b) . Die Reaktionsoberf lache muB 
grofi genug sein, urn die notwendige Anzahl der NSKFs bei 
entsprechender Dichte immobilisieren zu k6nnen. Die Reaktions- 
oberflache sollte vorzugsweise nicht groSer als 20 cm 2 sein. 

35 Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionsl6s\ingen fiber der Oberflache. Die 
Reaktionsoberf ISche ist vorzugsweise Bestandteil eines 
Reaktionsgef &fies . Das Reaktionsgefafc ist wiederum vorzugsweise 
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Bestandteil einer Reaktionsapparatur mit Durchf luSvorrichtung . 
Die DurchfluSvorrichtung ermSglicht einen Austausch der 
Ldsungen im ReaktionsgefaB. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung Oder manuell 
5 erfolgen. Wichtig dabei ist, dass die Oberflache nicht 
austrocknet. Vorzugsweise betragt das Volumen des 
Reaktionsgefafces weniger als 50 pi. Idealerweise betragt sein 
Volumen weniger als 1 jil. Ein Beispiel eines solchen 
Duchflufisys terns ist in Fig. 6 gegeben. 

10 

Falls die Fixierung der NSKF-Primer-Komplexe auf der Oberflache 
uber die NSKFs erfolgt, kann dies beispielsweise durch die 
Bindung der NSKFs an einem der beiden Ketten-Enden erfolgen. 
Dies kann durch entsprechende kovalente, affine oder andere 

15 Bindungen erreicht werden. Es sind viele Beispiele der 
Immobilisierung von Nukleins&uren bekannt (McGall et al. US 
Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et 
al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton Publishing, 

20 "DNA Microarrays" 1999 M. Schena Oxford University Press, 
Rasmussen et al. Analytical Biochemistry v. 198, S.138, Allemand 
et al. Biophysical Journal 1997, v. 73, S.2064, Trabesinger et 
al. Analytical Chemistry 1999, v. 71, S.279, Osborne et al. 
Analytical Chemistry 2000, v. 72, S.3678, Timofeev et al. 

25 Nucleic Acid Research (NAR) 1996, v. 24 S.3142, Ghosh et al. NAR 
1987 v.15 S.5353, Gingeras et al. NAR 1987 v. 15 S.5373, Maskos 
et al. NAR 1992 v. 20 S.1679) . Die Fixierung kann auch durch 
eine unspezif ische Bindung, wie z.B. durch Austrocknung der 
NSKFs enthaltenden Probe auf der planen Oberflache erreicht 

30 werden. 

Die NSKFs werden auf der OberflsLche beispielsweise in einer 
Dichte zwischen 10 und 100 NSKFs pro 100 pm 2 , 100 bis 10.000 pro 
100 fim 2 , 10.000 bis 1.000.000 pro 100/xm 2 gebunden. 

35 

Die far die Detektion notwendige Dichte von extens ions f&hi gen 
NSKF- Primer -Komplexen betragt ca. 10 bis 100 pro 100 pm 2 . Sie 
kann vor, wShrend oder nach der Hybridisierung der Primer an 
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die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
von NSKF-Primer-Komplexen naher dargestellt: In einer Aus- 
5 ftihrungsform erfolgt die Immobilisierung der NSKFs tiber Biotin- 
Avidin oder Biotin-Streptavidin-Bindung. Dabei wird Avidin oder 
Streptavidin auf der Oberflache kovalent gebunden, das 5 f ~Ende 
des Primers enth&lt Biotin. Nach der Hybridisierung der 
markierten Primer mit den NSKFs (in Losung) werden diese auf 
10 der mit Avidin/Streptavidin beschichteten Oberflache fixiert. 
Die Konzentration der mit Biotin markierten Hybridisierungs- 
Produkte sowie die Zeit der Inkubation dieser Losung mit der 
Oberflache wird so gewahlt, dass eine fur die Sequenzierung 
geeignete Dichte bereits in diesem Schritt erreicht wird. 

15 

In einer anderen bevorzugten Ausfiihrungsform werden die Fur die 
Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstr&ngigen NSKFs mit jeweils 

20 einer Primerbindungsstelle pro NSKF werden damit unter 
Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden 
sie an die fixierten Primer und werden dadurch gebunden 
(indirekte Bindung), wobei Primer-NSKF-Komplexe entstehen. Die 
Konzentration der einzelstr&ngigen NSKFs und die 

25 Hybridisierungsbedingungen werden so gewShlt, dass man eine fur 
die Sequenzierung geeignete Immobilisationsdichte von 10 bis 
100 extensionsfShigen NSKF-Primer-Komplexen pro 100 pm 2 
erreicht. Nach der Hybridisierung werden ungebundene NSKFs 
durch einen Waschschritt entfernt. Bei dieser Ausfiihrungsform 

30 wird eine Oberflache mit einer hohen Primerdichte bevorzugt, 
z.B. ca. 1.000.000 Primer pro 100/im 2 oder noch hoher, da die 
gewCinschte Dichte an NSKF-Primer-Komplexen schneller erreicht 
wird, wobei die NSKFs nur an einen Teil der Primer binden. 

35 In einer anderen Ausfuhrungsform werden die NSKFs an die 
Oberflache direkt gebunden (s.o.) und anschlieSend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 NSKFs pro 100/xm 2 wird man versuchen alle 
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verfiigbaren NSKFs mit einem Primer zu versehen und fttr die 
Sequenzierugnsreaktion verfugbar zu machen. Dies kann z.B, 
durch hohe Primerkonzentration, beispielsweise 1 bis 100 
mmol/1, erreicht werden. Bei einer hoheren Dichte der fixierten 
5 NSKFs auf der OberflSche, beispielsweise 10.000 bis 1.000,000 
pro 100/im 2 , kann die ffir die optische Detektion notwendige 
Dichte der NSKF-Primer-Komplexe w&hrend der Primer- 
Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, 
10 Primerkonzentration) so zu wahlen, dass die Primer nur an 
einen Teil der immobilisierten NSKFs binden, s. Beispiel 5,6. 

Falls die Oberflache einer festen Phase (z.B. Silikon oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine 
15 Blockierungsldsung auf die OberflSche vor dem Schritt (a) in 
jedem Zyklus gebracht, die zur Vermeidung einer unspezif ischen 

■ 

Adsorbtion von NTs* an der Oberflache dient. Diese Bedingungen 
fur eine Blockierlosung erfullt beispielsweise eine 
AlbuminlSsung (BSA) mit einem pH-Wert zwischen 8 und 10. 

20 

4.4 Wahl der Polymerase 

Als Polymerasen eignen sich prinzipiell alle DNA-abhSngigen 
DNA- Polymerasen ohne 3* -5' Exonuklease-Aktivit&t (DNA- 

25 Replication" 1992 Ed. A.Kornberg, Freeman and company NY), z.B. 
modifizierte T7-Polymerase vom Typ "Sequenase Version 2" 
(Amersham Pharmacia Biotech), 3' -5' exonuklease freies Klenow 
Fragment der DNA- Polymerase I (Amersham Pharmacia Biotech) , 
Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA 

30 Polymerases" 1983, Fry M. , CRC Press Inc., kommerziell 
erh&ltlich bei Chimerx) thermostabile Polymerasen wie 
beispielsweise Taq- Polymerase (GibcoBRL) , proHATM Polymerase 
(Eurogentech) . 

35 Polymerasen mit 3* -5* Exonuklease-Aktivitat k6nnen eingesetzt 
werden (z.B. Klenow- Fragment der E . coli - Polymerase I ) , sof ern 
Reaktionsbedingungen gewShlt werden, die vorhandene 3' -5' 
Exonuklease-Aktivitat unterdrttcken, wie z.B. ein niedriger pH- 
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Wert (pH 6.5) beim Klenow- Fragment (Lehman and Richardson, J. 
Biol. Chem. 1964 v. 239 S.233) Oder Zugabe von NaF zur 
Einbaureaktion. Eine andere Mdglichkeit besteht in der 
Verwendung von NTs* mit einer Phosphorothioate-Verbindung 
5 (Kunkel et al. PNAS 1981, v. 78 S.6734). Dabei werden eingebaute 
NTs* von der 3' -5' Exonuklease-Aktivitat der Polymerase nicht 
angegriffen. Im folgenden werden all diese Polymerasearten als 
"Polymerase" bezeichnet. 

4 

10 4.5 Chemie 

4.5.1 Allgemeines Prinzip 

Fur die Sequenzierungsreaktion bei hoch paralleler 
15 Sequenzanalyse an einzelnen Nukleinsaure-Molekulen (parallele 
Analyse von bis zu 10.000.000 NSKF-Sequenzen) ist wichtig, dass 
jedes eingebaute NT* identif iziert wird. Eine Voraussetzung 
dafur ist, dass nur ein einziges NT* pro Zyklus in die 
Nukleinsaurekette eingebaut wird. Falls eine Polymerase mehrere 
20 NTs* nacheinander im selben Zyklus einbaut, so fuhrt dies zu 
einem Fehler in der Sequenzermittlung. Aus diesem Grund muS man 
den Einbau der NTs* steuern. 

Beispielsweise wurden in der BASS-Methode reversible 3 • -OH 
modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard 

25 et al. US Patent 5.798.210, Rasolon j atovo Nucleosides & 
Nucleotides 1999, v. 18 S.1021, Metzker et al. NAR 1994, v. 22, 
S.4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, 
S.197). Die Spaltung soil dabei unter milden Bedingungen 
photochemisch (Dower US Patent 5,547.839, Welch et al. 

30 Nucleosides & Nucleotides 1999, v. 18, S.197) Oder chemisch 
(Canard et al. US Patent 5.798,210, Rasolonjatovo Nucleosides & 
Nucleotides 1999, v. 18 S,1021) erfolgen. 

Die Synthese der 3 » -OH-modif izierten photochemisch spaltbaren 
35 NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter- 
schiedliche AffinitSt zu diesen Nukleotidanalogen auf, so dass 
die Nukleinsfturesynthese sehr ungleichmSSig bzw. an vielen DNA- 
Stellen gar nicht ablftuft (Metzker et al. NAR 1994 v. 22 S.4259, 
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Welch et al- Nucleosides & Nucleotides 1999, v. 18 S.197). Aus 
diesen Grtinden eignen sich diese Analoga nicht oder nur sehr 
eingeschrSnkt fOr die Sequenzierungsreaktion. Eine spaltbare 
3 1 -Ester-Verknttpfung (Canard et al. US Patent 5.798.210) kommt 
5 als Grundlage filx eine reversible Termination der Synthese auch 
nicht in Betracht. Die meisten Polymerasen spalten bei 
Verfagbarkeit eines n^chsten komplementaren NT 3'-OH-Ester- 
Verbindungen, so dass die an die 3'-0H-Gruppe gebundene 
Markierung in die Ldsung freigesetzt wird und nicht mehr als 

10 Terminator wirken kann (Rasolonjatovo et al. Nucleosides & 
Nucleotides 1999, v. 18 S.1021, Canard et al. PNAS 1995 v. 92 
S. 10859) . In Positionen, an denen eine Polymerase mehrere 
gleiche NTs* nacheinander einbauen kann, fuhrt das zu einem 
fehlerhaften Signal. Im AbschluSbericht des BMBF- 

15 Verbundsprojekts „Sequenzierung mit Multiplexfarbstof f en und 
Kapillarelektrophorese" G. Sagner, 1999, wurde berichtet, dass 
Modif ikationen der 3 1 -Position von Nukleotiden zur Auf hebung 
ihrer Subs trateigenschaf ten far Polymerasen gefuhrt haben. 

20 Die Schwierigkeiten bei der Entwicklung passender NT-Analoga 
fur das Verfahren basieren auf folgenden Rahmenbedingungen : 

1) Die Reaktion muss so gesteuert werden, dass die Polymerase 
NT*s einzeln einbaut (Stop des weiteren Einbaus) . 

2) NT*s mussen einen Farbstoff tragen, der den Anforderungen 
25 der Detektion genugt. 

3) Der Farbstoff mu£ unter milden Bedingungen abspaltbar 
sein, so dass weder die NSKF-Primer-Komplexe, noch 
einzelne Komponenten des Systems beschadigt werden. 

4) Die Abspaltung muss m6glichst schnell xand quant itativ 
30 erfolgen. 

5) Der Stop des Einbaus muss reversibel sein und unter milden 
Bedingungen aufgehoben werden konnen. 

Bis jetzt wurde keine praktisch brauchbare L6sung fGr diese 
35 Probleme in der einschlagigen Literatvir vorgestellt. 



Durch die vorliegende Erfindung werden nunmehr die im Stcind 
der Technik bekannten Probleme erstmals geldst. Erf indungsgem&6 
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werden filr die Sequenzierung NTs* mit einer sterisch 
anspruchsvollen Gruppe an der Base verwendet. 

Eine an die Base gekoppelte sterisch anspruchs voile Gruppe kann 
5 zur Behinderung der weiteren Synthese fuhren, wobei diese 
Behinderung in der Fachliteratur als unerwiinschte Eigenschaft 
modifizierter NTs bei der Markierung von NukleinsSuren 
angesehen wird. Biotin, Digoxigenin und Fluoreszenzfarbstof fe 
wie Fluoreszein, Tetramethylrhodamine, Cy3-Farbstof f stellen 
10 Beispiele einer solchen sterisch anspruchsvollen Gruppe dar 
(Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al. NAR 1994, 
v. 22, S.3418, Gebeyehu et al., NAR 1987, v. 15, S.4513, Wiemann 
et al. Analytical Biochemistry 1996, v. 234, S.166, Heer et al. 
BioTechniques 1994 v. 16 S.54). 

15 

Bei der Sequenzierungsreaktion im erf indungsgemafcen Verfahren 
werden markierte NTs* mit einer Polymerase und Nukleins&ureket- 
ten inkubiert. Die NTs* tragen dabei eine an die Base reversibel 
gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions- 

20 gemisch, das nur modifizierte NTs* enthalt, in der Reaktion 
eingesetzt wird, dann kann die Polymerase nur ein einziges NT* 
einbauen. Der Einbau eines nachsten NT* wird sterisch gehemmt. 
Diese NTs* treten somit als Terminatoren der Synthese auf. Nach 
der Entfernung der sterisch anspruchsvollen Gruppe kann das 

25 nSchste komplementcLre NT* eingebaut werden. Weil diese NTs* kein 
absolutes Hindernis zur weiteren Synthese darstellen, sondern 
nur fflr den Einbau eines weiteren markierten NT*, werden sie als 
Semiterminatoren bezeichnet . 

30 Der Unterschied zur 3' -OH Terminatoren- Me thode besteht darin, 
dass nicht eine Blockade der f tir die Synthese notwendigen 3 1 -OH 
Gruppe angestrebt wird, sondern eine an die Base geknttpfte 
Gruppe als sterisches Hindernis fiir den weiteren Einbau genutzt 
wird. Die 3 '-OH Gruppe bleibt dabei die ganze Zeit frei. 

35 

4.5.2 Allgemeine Struktur des NT* 

Ihre gemeinsamen Merkmale sind in Fig. 7a,b,d dargestellt. 
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Diese Struktur ist dadurch charakterisiert, dass an der Base 
fiber einen spaltbaren Linker (A-E) eine sterische Gruppe (D) 
und der Fluoreszenzmarker (F) gebunden sind. 

5 Als Grundlage fur die NTs* dienen Deoxynukleosid- Triphosphate 
mit Adenosin (A), Guanosin(G) , Cytidin (C) und Thymidin (T) als 
Nukleosidrest. Anstelle von Thymidin wird bevorzugt Uridin als 
Nukleosidrest verwendet. Anstelle von Guanosin kann Inosin ver- 
wendet werden. 

10 

4.5.3 Marker , Fluorophore 

Jede Base ist mit einem fur sie charakteristischen Marker (F) 
markiert (Fig. 7) . Der Marker ist ein f luoreszierender Farb- 
15 stoff . Mehrere Faktoren beeinflussen die Wahl des Fluoreszenz- 
farbstoffes. Die Wahl ist nicht eingeschrankt, sofern der Farb- 
stoff folgenden Anforderungen genugt: 

a) Die verwendete Detektionsapparatur muJS diesen Marker als 
20 einziges Molekul gebunden an DNA unter milden Bedingungen (vor- 

zugsweise Reaktionsbedingungen) identif izieren kSnnen. Die 
Farbstoffe haben vorzugsweise grofce Photostabilit&t . Ihre 
Fluoreszenz wird vorzugsweise von der DNA nicht oder nur 
unwesentlich gequencht. 

25 

b) Der an das NT gebundene Farbstoff darf keine irreversible 
Stdrung der enzymatischen Reaktion verursachen. 

c) mit dem Farbstoff markierte NTs* mftssen von der Polymerase in 
30 die Nukleins&urekette eingebaut werden. 

d) Bei einer Markierung mit verschiedenen Farbstoffen sollen 
diese Farbstoffe keine betrSchtlichen Oberlappungen in ihren 
Emissionsspektren aufweisen. 

35 

Im Rahmen der vorliegenden Erfindung verwendbare 
Fluoreszenzfarbstof fe sind in "Handbook of Fluorescent Probes 
und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular 
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Probes mit Strukturformeln zusammengestellt . Erf indungsgem&S 
werden vorzugsweise folgende Farbstof fklassen als Marker 
eingesetzt: Cyanin- Farbstof fe und deren Abkommlinge (z.B. Cy2, 
Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US -Patent 
5 5.268.486), Rhodamine und deren Abkommlinge (z.B. TAMRA, TRITC, 
RG6, R110, ROX, Molecular Probes, s. Handbuch) , Xanthene- 
Derivate (z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et 
al. US-Patent 6.130.101). Diese Farbstof fe sind kommerziell 
erMltlich. 

10 

Dabei kann man je nach spektralen Eigenschaften und vorhandener 
Apparatur entsprechende Farbstof fe ausw^hlen. Die Farbstof fe 
werden an den Linker z.B. tiber Thiocyanat- oder Ester-Bindung 
gekoppelt ("Handbook of Fluorescent Probes und Research Chemi- 
15 cals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et 
al. Methods in Enzymology 1997 v,278 S.363, Waggoner ^Methods in 
Enzymology 1995 v. 246 S.362), s. Beispiele 1 und 2. 



20 



4.5.4 Natur der sterisch anspruchsvollen Gruppe - ^ w 



Die Gruppe (D) (Fig. 7a,b,d) stellt ein Hiiidernis 'fur den 
Einbau eines weiteren komplement&re'fi "markierten NT durch eine 
Polymerase dar. Biotin, Digoxigenin und Fluoreszenzfarbstof fe 
stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe 

25 dar (Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al. NAR 
1994, v. 22, S.3418, Gebeyehu et al., NAR 1987, v. 15, S.4513, 
Wiemann et al. Analytical Biochemistry 1996, v. 234, S.166, Heer 
et al. BioTechniques 1994 v. 16 S.54). Die chemische Struktur 
dieser Gruppe ist nicht eingeschr&nkt, sofern sie den Einbau 

30 des markierten NT*, an das sie geknQpft ist, jiicht wesentlich 
stdrt und keine irreversible StSrung der enzymatischen Reaktion 
verursacht . 



Diese Gruppe kann als selbstSndiger Teil im Linker (7a) auf- 
35 treten oder mit dem Farbstof f (7b) oder der spaltbaren Gruppe 
(7d) identisch sein. Durch die Spaltung des Linkers wird diese 
sterisch anspruchs voile Gruppe (D) nach der Detektion des Si- 
gnals entfernt, so dass die Polymerase ein weiteres markiertes 
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NT* einbauen kann. Bei einer Struktur wie in 7d wird die steri- 
sche Gruppe durch die Spaltung beseitigt. 

5 In einer bevorzugten Ausftkhrungsform Obernimmt der Fluoreszenz- 
farbstoff die Funktion einer solchen sterisch anspruchsvollen 
Gruppe, so dass ein markiertes Nukleotid eine in Fig. 7b,k,l 
dargestellte Struktur aufweist. 

10 In einer anderen bevorzugten Ausfiihrungsform tibernimmt die 
photolabile spaltbare Gruppe die Funktion einer solchen 
sterisch anspruchsvollen Gruppe (Fig. 7d) . 

4.5.5 Linker 

15 

Der Marker (Fluoreszenzfarbstof f ) ist an die Base vorzugsweise 
uber einen Abstandhalter unterschiedlicher L&nge, einen sog. 
Linker, gebunden. Beispiele fflr Linker sind in Fig. 
7e, f ,h, i, j ,k, l,m gegeben. Vorzugsweise ist dieser Linker an 

20 einer der Stellen an die Base gebunden, die nicht an der 
Basenpaarung teilnimmt. Im bevorzugten Fall sind die Stellen, 
an die der Linker gebunden ist: die 5-Position im Pyrimidinring 
und die 7 -Position Oder 8 -Position im Purinring. Beispiele der 
Ankoppelung eines Linkers an die Base kdnnen aus folgenden 

25 Quellen entnommen werden (Hobbs et al. US Patent 5.047.519, 
Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 
1996 v. 274, S.403, Zhu et al . NAR 1994 v.22 S.3418, Herman et 
al. Methods in Enzymology 1990 v. 184 S.584, J.L.Ruth et al. 
Molecular Pharmacology 1981 v. 20 S.415, L. 6tv6s et al, NAR 

30 1987 v. 15 S.1763, G.E.Wright et al. Pharmac Ther. 1990 v. 47, 
S.447, „Nucleotide Analogs; Synthesis and Biological Function" 
K.H. Scheit 1980, Wiley- Interscience Publication, "Nucleic acid 
chemistry" Ed. L.B.Townsend, v. 1-4, Wiley- Interscience 
Publication, "Chemistry of Nucleosides and Nucleotides" Ed. 

35 L.B.Townsend, v. 1-3, Plenum Press) . 

Die gesamte L&nge des Linkers kann variieren. Sie entspricht 
der Anzahl der Kohlenstof f-Atome in den Abschnitten A, C, E 
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(Fig. 7a,b,d) und liegt vorzugsweise zwischen 3 und 20. 

Optimalerweise betr^gt sie zwischen 4 und 10 Atomen. Die 

chemische Zusatnmensetzung des Linkers (Abschnitte A,C,E in Fig. 
7a,b,d) ist nicht eingeschr&nkt, sofern sie unter 

5 Reaktionsbedingungen stabil bleibt und keine StSrung der 
enzymatischen Reaktion verursacht. 

4.5.6 Spaltbare Verbindung, Spaltung 

10 Der Linker tragt eine spaltbare Verbindung oder spaltbare 
Gruppe (Abschnitt (B) in Fig. 7a,b,d und Abschnitt (C) in Fig. 
7k, 1). Diese spaltbare Verbindung ermoglicht die Entfernung des 
Markers und des sterischen Hindernisses am Ende jedes Zyklus. 
Ihre Wahl ist nicht eingeschrankt , sofern sie unter den Bedin- 

15 gungen der enzymatischen Sequenzierungsreaktion stabil bleibt, 
keine irreversible Storung der Polymerase verursacht und unter 
milden Bedingungen abgespalten werden kann. Unter "milden 
Bedingungen" sind solche Bedingungen zu verstehen, die den 
NSKF-Primer-Komplex nicht zerstdren, wobei z.B. der pH-Wert 

20 vorzugsweise zwischen 3 und 11 liegt, die Temperatur zwischen 

0°C und einem Temperaturwert (x) . Dieser Temperaturwert (x) 
hangt von der Tm des NSKF-Primer-Komplexes (Tm ist "melting 
Point") und wird beispielsweise als Tm (NSKF-Primer-Komplex) 

minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximale 

25 Temperatur bei 42°C; unter diesen Bedingungen eignen sich 
besonders Ester-, Thioester-, Disulf id- Verbindungen und 
photolabile Verbindungen als spaltbare Verbindungen) . 

Vorzugsweise gehort die genannte Verbindung zu chemisch Oder 
30 enzymatisch spaltbaren oder photolabilen Verbindungen. Als 
Beispiele von chemisch spaltbaren Gruppen sind Ester- , 
Thioester- und Disulf id-Verbindungen bevorzugt (Fig. 7k, 1) 
(„Chemistry of protein conjugation and crosslinking" Shan S. 
Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 
35 1990 v.184 S.584, Lomant et al. J.Mol.Biol. 1976 v. 104 243, 
"Chemistry of carboxylic acid and esters" S.Patai 1969 
Interscience Publ . ) . Beispiele f (ir photolabile Verbindungen 
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(Pig. 7m) konnen in folgenden Literaturstellen gefunden werden: 
"Protective groups in organic synthesis" 1991 John Wiley & 
Sons, Inc., V. Pillai Synthesis 1980 S.l, V. Pillai Org. 
Photochem. 1987 v. 9 S.225, Dissertation „Neue photolabile 
5 Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" 
H.Giegrich, 1996, Konstanz, Dissertation „Neue photolabile 
Schutzgruppen f\lr die lichtgesteuerte Oligonucleotidsynthese" 
S.M.Buhler, 1999, Konstanz) . . 

10 Die Position der spaltbaren Verbindung/Gruppe im Linker ist 
vorzugsweise nicht weiter als 10 Atome von der Base entfernt, 
noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt 
liegt die spaltbare Verbindung oder Gruppe direkt an der Base. 

15 Der Spaltungs- und Entf ernungs-Schritt ist in jedem Zyklus vor- 
handen und muS unter milden Bedingungen (s.o.) verlaufen, so 
dass die Nukleinsauren nicht beschadigt oder modifiziert 
werden. 

20 Die Spaltung lSuft bevorzugt chemisch (z.B. in milder saurer 
oder basischer Umgebung f\ir eine Ester-Verbindung oder durch 
Zugabe eines Reduktionsmittel, z.B. Dithiothreitol oder 
Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- 
Verbindung) , siehe Beispiel 1, oder physikalisch (z.B. durch 

25 Beleuchtung der Oberflache mit Licht einer bestimmten 
Wellenl&nge fur die Spaltung einer photolabilen Gruppe, 
Dissertation „Neue photolabile Schutzgruppen ftir die 
lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, 
Konstanz) ab. 

30 

Nach der Spaltung verbleibt an der Base ein Linkerrest (A) 
(Fig. 7c) . Falls die nach der Spaltung am Linkerrest frei 
gewordene Mercapto -Gruppe weitere Reaktionen st6rt, kann sie 
mit bekannten Mitteln chemisch modifiziert werden (wie z.B. 
35 durch Disulfid- oder Iodacetatverbindungen) . 

Die Synthese eines spaltbaren Linkers wird an Beispielen 
gezeigt (vgl. Beispiele 1 und 2). 
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4.5.7 Kombination von Polymerase und NT* 

Insgesamt spielen die Gr6Se, die Ladling und die chemische 
Struktur des Markers, die Lange des spaltbaren Linkers und des 
5 Linker-Rests sowie auch die Wahl der Polymerase eine wichtige 
Rolle. Sie bestimmen gemeinsam, ob das markierte NT* durch die 
Polymerase in die wachsende Nukleins&urekette eingebaut wird, 
und ob dadurch der Einbau des n&chsten markierten NT* verhindert 
wird. Zwei Bedingungen sind dabei besonders zu berucksichtigen: 

10 

Einerseits ist es wichtig, dass die Polymerase die 
Nukleins&urekette mit dem eingebauten modif izierten NT* nach der 
Spaltung des Linkers weiter verlangern kann. Es ist also 
wichtig, dass der Linkerrest "A" (Fig. 7c) nach der Spaltung 

15 keine wesentliche St6rung fur die weitere Synthese darstellt. 
Andererseits mfissen eingebaute, nicht gespaltene NTs* ein 
Hindernis darstellen. Es konnen viele fur die Reaktion 
geeignete NTs* synthetisiert werden. Im einzelnen mu£ fur jede 
Kombination aus Polymerase und NTs* eine Vorversuchsreihe 

20 durchgefuhrt werden, in der die Tauglichkeit eines bestimmten 
NT*-Typs fur die Sequenzierung erprobt wird. 

Die Puf ferbedingungen werden nach Angaben des 
Polymeraseherstellers gewahlt. Die Reaktionstemperatur wird ftir 
25 nicht thermos tabile Polymerasen nach Angaben des Hers tellers 

gewahlt (z.B. 37°C fttr Sequenase Version 2), ftir thermostabile 
Polymerasen (z.B. Taq- Polymerase) betragt die 

Reaktionstemperatur maximal den Temperaturwert (x) . Dieser 
Temperaturwert (x) hangt von der Tm des NSKF-Primer-Komplexes 

30 und wird z.B. als Tm (NSKF-Primer-Komplex) minus 5°C errechnet 

(z.B. Tm ist 47°C, dann liegt die maximale Reaktionstemperatur 

bei 42°C) . Diese Puf ferbedingungen und Reaktionstemperatur 
werden weiter als "optimale Puffer- und Tempera turbedingungen" 
bezeichnet . 

35 

Die Reaktionszeit (entspricht der Dauer des Einbau- Schrittes in 
einem Zyklus) betr&gt vorzugsweise weniger als eine Stunde, 
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idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 
min. 

Als Beispiele von geeigneten Kombinationen zwischen NT* und 
5 Polymerase sind folgende Kombinationen zu nennen: 

a) NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, 
Fig. 7e,h,i): dNTP-SS-TRITC (L7) , dNTP-SS-Cy3 (Lll) in Kombina- 
tion mit Sequenase Version 2, Kl enow- Fragment DNA- Polymerase I 

10 E.coli, Taq- Polymerase (GibcoBRL) . 

b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, 
Fig. 7f,g,j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase 
Version 2 oder, Kl enow -Fragment DNA- Polymerase I E.coli oder 
ProHATM- Polymerase (Eurogentech) . 

15 

Die Tauglichkeit eines Linkerrests an der Base (A) fur die 
Reaktion wird in einem Testsystem gepriift. Dabei werden 
gespaltene NTs* in eine Nukleins&urekette nacheinander einbaut. 
Man verwendet z.B. dUTP* mit dem gewiinschten gespaltenen 

20 Linkerrest, poly-dA als Matrize, Oligo-dT20- Primer, die 
gewunschte Polymerase und fuhrt unter fur die jeweilige 
Polymerase geeigneten optimalen Puffer- und 

Temperaturbedingungen eine Reaktion durch. Die NT*-Konzentration 
liegt vorzugsweise zwischen 5 ymol/l und 200 pmol/1. Nach der 

25 Reaktion wird die Anzahl der in die Nukleinsaurekette 
eingebauten NTs* analysiert, z.B. durch die Auftrennung der 
Lange nach in einem Gel. Fur die Ruckschliisse auf die 
Tauglichkeit des Linkerrests kann man folgende Angaben 
verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kaim, 

30 so ist dieser Linkerrest fur eine Sequenzierungsreaktion 
geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist 
diese Kombination aus NT* und Polymerase nicht optimal fUr die 
Sequenzierungsreakt ion . 

35 Wenn ein passender Linkerrest feststeht, wird in einem weiteren 
Testsystem gepriift, ob die markierten, nicht gespaltenen NTs* 
als Semiterminatoren funktionieren. Das wird gepruft, indem die 
markierten NTs* unter fftr die Reaktion geeigneten optimalen 
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Puffer- und Temperaturbedingungen mit der Polymerase und einer 
Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugs- 
weise zwischen 5 ymol/1 und 200 pmol/1. Die Matrize ist so zu 
wahlen, dass der Einbau mehrerer NTs* nacheinander zu erwarten 
5 wSre, z.B. filr dUTP* kann man polydA, wie im oben darges tell ten 
Beispiel verwenden. Idealerweise baut die Polymerase nur ein 
einziges NT* ein. 

Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen 
10 durch eine Polymerase mehrere NTs* nacheinander eingebaut 
werden, kann man die Reaktionsparameter (z.B, NT'-Konzentration, 
Reaktionstemperatur) ver&ndern und der jeweiligen Kombination 
aus Polymerase und NT* anpassen. Das wichtigste dabei ist, dass 
die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise 
15 zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut. 

ErfindungsgemaS erfolgt diese Anpassung in einer 
Aus fuhrungs form durch die Veranderung der Reaktionstemperatur. 
Die anderen Parameter der Reaktion werden dabei konstant 
20 gehalten. 

Die NT*-Konzentration liegt bei diesen Experimenten Oblicherwei- 
se zwischen 5 pmol/1 und 200 pmol/1, vorzugsweise zwischen 10 
pmol/1 und 100 pmol/1. Die Konzentration der Polymerase und die 

25 Pufferbedingungen werden nach Angaben vom Hersteller gewahlt. 
Die Dauer der Reaktion kann variieren und liegt vorzugsweise 
zwischen 10 sec und 10 min, was der Dauer des Einbau-Schrittes 
(a) in einem Zyklus entsprechen wurde. Bei nicht thermostabilen 
Polymerasen wie z.B. Sequenase Version 2 (Amersham Pharmacia 

30 Biotech) , exonuclease free Klenow- Fragment der DNA Polymerase I 
(Amersham Pharmacia Biotech) wird die Reaktionsthemperatur von 

konventionellen 37°C vorzugsweise auf 20°C bis 30°C reduziert. 
Bei thermostabilen Polymerasen wie z.B. Taq- Polymerase (Gib- 
coBRL) , ProHATM- Polymerase (Eurogentech) wird die Reaktion- 

35 stemperatur von konventionellen 70-75°C vorzugsweise auf Werte 

reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen. 
Dieser Temperaturwert (x) hSngt von der Tm des NSKF-Primer- 
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Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C 
errechnet (z.B. Tm ist 47°C, dann liegt der Temperaturwert (x) 
bei 42°C) . 

5 In einer anderen bevorzugten Ausfuhrungsform der Erfindung er- 
folgt die Anpassung der Reaktionsbedingungen durch die 
Verminderung der NT* -Konzentration auf unter 5 pmol/1, die 
anderen Parameter der Reaktion (Puf ferbedingungen, 
Tender a turbedingungen) werden konstant gehalten. Die 

10 Konzentration der NT* liegt vorzugsweise bei dieser Anpassung 
zwischen 0.5 pnol/1 und 5 pmol/1. Die Dauer der Reaktion liegt 
zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*- 
Konzentration ist, dass die Polymerase in der vorgegebenen Zeit 
(liegt vorzugsweise zwischen 10 sec void 10 min) ein zweites NT* 

15 nicht einbaut. 

Nach Optimierung der Reaktionsbedingungen fiir den Einbau eines 
einzelnen NT* muS man die Reaktion mit gespaltenen NTs* wieder- 
holen. Unter entsprechend geanderten Reaktionsparameter muS 
20 Polymerase die gespaltenen NTs* nacheinander einbauen konnen. 

Die Optimierungsreaktion korreliert mit dem Einbauschritt, 
Schritt (b) , in einem Zyklus. Die fur die Optimierungsreaktion 
ermittelten Bedingungen, die Temperatur, die Konzentration an 
25 NT*, die Puf ferbedingungen, die Dauer der Reaktion werden f\ir 
die Reaktion auf der Oberflache ubernommen. 

Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in 
die NSKF-Primer-Komplexe vorzugsweise so, dass an mehr als 50% 

30 der an der Sequenzierungsreaktion beteiligten NSKF- Primer- 
Komplexen in einem Zyklus ein markiertes NT* eingebaut wird, 
vorzugsweise an mehr als 90%. Das h&ngt damit zusammen, dass an 
manchen NukleinsSureketten die Reaktion sehr langsam ablauft, 
Ein Einbau der NTs* an jeder komplement&ren Position in jedem 

35 Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur 
die erfolgreichen Einbaureaktionen detektiert und ausgewertet 
werden; eine verz&gerte Reation im Nachfolgenden Zyklus fuhrt 
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nicht zu einem Sequenzierungsfehler . 

Vorzugsweise wird far alle NTs* dieselbe Polymerase verwendet. 
Es kdnnen aber auch verschiedene Polymerasen ftir verschiedene 
5 NTs* eingesetzt werden. 

4.5.8 Farbiges Kodierungs schema, Anzahl der Farbstoffe 

Einen Zyklus kann man durchftihren mit: 

a) vier verschieden markierten NT*s 

b) zwei verschieden markierten NT*s 

c) einem markierten NT* 

d) zwei verschieden markierten NT*s und zwei unmarkierten 
NTs, 

d.h. 

a) Man kann alle 4 NTs mit verschiedenen Farbstoffen 
20 markieren und alle 4 gleichzeitig in die Reaktion einsetzten. 

Dabei erreicht man die Sequenzierung einer Nukleinsaurekette 
mit einer minimalen Anzahl von Zyklen. Diese Variante der 
Erfindung stellt allerdings hohe Anforderungen an das 
Detektionssystem: 4 verschiedene Farbstoffe mGssen in jedem 
25 Zyklus identifiziert werden. 

b) Zur Vereinfachung der Detektion kann eine Markierung mit 
zwei Farbstoffen gewShlt werden. Dabei werden 2 Paare von NTs* 
gebildet, die jeweils verschieden markiert sind, z.B. A und G 

30 tragen die Markierung "X", C und U tragen die Markierung "Y" . 
In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich 
markierte NTs* gleichzeitig eingesetzt, z.B. C* in Kombination 
mit A*, und im darauf folgenden Zyklus (n+1) werden dann U* und G* 
zugegeben . 

35 

c) Man kann auch nur einen einzigen Farbstoff zur 
Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NT* 
e inset 2 en. 



10 



15 
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d) In einer technisch vereinfachten Ausfuhrungsform werden 
pro Zyklus zwei unterschiedlich markierte NT's eingesetzt und 
zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . Diese 
5 Ausftihrungsform kann verwendet werden, urn Varianten (z.B. Muta- 
tionen, Oder alternativ gespleifcte Gene) einer bereits 
bekannten Sequenz zu ermitteln. 

4.6 Detektionsapparatur 

10 

Einzelne Molekftle auf einer Oberflache kann man mit verschiede- 
nen Methoden untersuchen. Es sind mehrere Verfahren bekannt: 
z.B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahf eld- 
Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR- 
15 Mikroskopie us w. (Science 1999 v. 283 1667, Unger et al. BioTech- 
niques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 v. 92 S.161, 
Dickson et al. Science 1996 v. 274 S.966, Xie et al. Science 
1994 v.265 S.361, Nie et al. Science 1994 v. 266 S.1018, Betzig 
et al. Science 1993 v. 262 S.1422) . 

20 

ErfindungsgemaB werden Fluoreszenz-Signale einzelner in die 
Nukleinsaurekette eingebauter NTs* vorzugsweise mit einem 
Weitfeld-Fluoreszenz-Mikroskop (Epif luoreszenz) oder einem 
Laser- Scanning-Mikroskop (Epif luoreszenz) oder einem TIRF- 
25 Microskop (Total Internal Reflection Fluorescence Microscope) . 

Es sind verschiedene Varianten der Konstruktion einer solchen 
Apparatur moglich (Weston et al. J.Chem.Phys. 1998 v. 109 
S.7474, Trabesinger et al. Anal. Chem. 1999 v. 71 S.279, Adachi 

30 et al. Journal of Microscopy 1999 v. 195 S.125, Unger et al. 
BioTechniques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 v. 92 
S.161, Dickson et al. Science 1996 v. 274 S.966, Tokunaga et al. 
Bichem.Biophys.Res.com. 1997 v. 235 S.47, "Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 

35 Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
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J.Pawley Plenum Press ). Unterschiede in ihrem konkreten Aufbau 
ergeben sich aus der Variation ihrer Einzelteile. Die Vorrich- 
tung fOr das Anregungslicht kann z.B. auf der Basis eines La- 
sers, einer Lampe oder von Dioden funktionieren. FQr die Detek- 
5 t ions vor rich tung k6nnen sowohl CCD-Kameras als auch PMT dienen. 
Andere Beispiele fiir technische Details siehe ("Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 
Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluores- 

10 cence microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, 
"Handbook of biological confocal microscopy" 1995 J.Pawley 
Plenum Press) . Es ist nicht die Aufgabe dieser Erf indung, alle 
mdglichen technischen Varianten einer Detektionsvorrichtung 
aufzuzthlen. Der prinzipielle Aufbau einer geeigneten Apparatur 

15 wird in einem Schema Fig. 8 erlautert. Sie besteht aus 
folgenden Elementen: 

Lichtquelle zur Anregung der Fluoreszenz (1) 
Licht lei tender Teil (2) 
20 Scant isch (3) 

Vorrichtung zur Selektion von Spektren (4) 
Detektionsvorrichtung ( 5 ) 

Computer mit Steuerungs- und Analysefunktionen (6) 

25 Diese Elemente der Apparatur konnen kommerziell erworben werden 
(Mikroskop-Firmen: Zeiss, Leica, Nikon. Olympus) . 

Im folgenden soli beispielsweise eine fur die Detektion 
einzelner Molekule geeignete Kombination aus diesen Elementen 
30 vorgestellt werden: 

Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil- 
be r damp f 1 ampe 

Objektiv Planneofluar lOOx, NA 1.4 (Zeiss) 
35 Kamera Photometrix oder AxioCam (Zeiss) 

Computer mit Software zur Steuerung und Analyse 
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Nachfolgend soil die Vorgehensweise bei der Detektion erl&utert 
werden. Man beachte dabei die allgemeinen Regeln der Fluo- 
reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of 
5 optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC 
Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS 
Scientific Publishers, "Handbook of biological confocal 
microscopy" 1995 J.Pawley Plenum Press) . 



10 Die Detektion umfafct folgende Phasen: 



1) Vorbereitung zur Detektion 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus, 
wobei jeder Detektionsschritt als Scanvorgang abl&uft und 

15 folgende Operationen umfafct: 

a) Einstellung der Position des Objektivs (X,Y-Achse), 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekttle, Zuordnung 
des Signals zu NT* und Zuordnung des Signals zum 

20 jeweiligen NSKF, 

d) Verschiebung zur nachsten Position auf der Oberflache. 



Die Signale von in die NSKFs eingebauten NTs* werden durch das 
Abscannen der Oberflache registriert. Der Scanvorgang kann in 

25 verschiedener Weise ausgefuhrt werden ("Confocal Laser Scanning 
Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New 
Techniques of optical microscopy and microspectroscopy" 1991 
Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 
2.ed. Herman BIOS Scientific Publishers, "Handbook of 

30 biological confocal microscopy" 1995 J.Pawley Plenum Press). 
Beispielsweise wird ein diskontinuierlicher Scanvorgang 
gew&hlt. Dabei wird das Objektiv schrittweise fiber die 
Oberflache bewegt (Fig. 8a), so dass von jeder 
Oberfl&chenposition ein zweidimensionales Bild (2D-Bild) 

35 entsteht (Fig 8b, c), fur Versuchsanordnung b. Beispiel 6. 

Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: 
z.B. durch den Laser-Scan einer Position des Mikroskopf eldes 
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( Laser- Scanning-Microskopie) oder durch eine Kameraaufnahme an 
einer Position (vgl. Handbiicher der Mikroskopie) . Als Beispiel 
wird die Detektion einzelner MolekCLle rait einer CCD-Kamera 
beschrieben. 



Die Detektion wird schematisch am Beispiel der Sequenzierung 
eines 1Mb langen DNA-St\icks erlautert: 

10 1) Vorbereitung zur Detektion: 

Am Anfang wird festgelegt, wie viele NSKF-Sequenzen zur 
Rekonstruktion der ursprunglichen Sequenz analysiert werden 
nriissen. Im Fall einer Rekonstruktion nach dem Schrotschufc- 
Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 

15 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
NAR 1995 v.23 S.4992, Miller et al. J . Comput . Biol . 1994 v.l 
S.257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF 
wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs 

20 bestimmt. 2) Die Gesamtlange der zu analysierenden Sequenz ist 

wichtig. 3) Bei der Sequenzierung mufi ein bestimmtes Mafi an 

Redundanz erreicht werden, um die Genauigkeit zu steigern und 

eventuelle Fehler zu korrigieren. Insgesamt ist zur 

Rekonstruktion des grdfiten Teils der ursprvinglichen Sequenz die 

* 

25 etwa 10- bis 100 -f ache Menge an Rohsequenzen erforderlich, d.h. 
bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb 
Rohsequenzdaten gebraucht . Bei einer durchschnittlichen 
SequenzlSnge von 400 bp pro NSKF benotigt man entsprechend 
25.000 bis 250.000 DNA- Fragment e . 

30 

2) Durchfflhrung eines Detektionsschrittes in jedem Zyklus 
Zur Sequenzierung nriissen die Positionen der NSKFs bestimmt wer- 
den, damit man eine Grundlage fur die Zuordnung der Signale 
hat. Die Kenntnis dieser Positionen erlaubt eine Aussage 
35 daruber, ob die Signale einzelner Molekule von eingebauten NTs* 
stammen oder von zufailig an die Oberfl&che gebundenen NTs* . 
Diese Positionen k&nnen mit verschiedenen Methoden 
identif iziert werden. 
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In einer bevorzugten Ausffihrungsform werden die Positionen 
gebundener NSKF-Primer-Komplexe wahrend der Sequenzierung 
identifiziert. Dabei wird die Tatsache genutzt, dass die 
5 Signale von den in die NukleinsSurekette eingebauten NTs* immer 
dieselben Koordinaten haben. Das ist durch die Fixierung der 
NukleinsSureketten gewahrleistet . Die unspezifisch gebundenen 
NTs* binden zuf&llig an verschieden Stellen der Oberfiache. 

10 Zur Identifizierung der Positionen von fixierten NSKFs werden 
die Signale auf Obereinstimmung ihrer Koordinaten aus mehreren 
aufeinander folgenden Zyklen fiberpruft. Das kann z.B. am Anfang 
der Sequenzierung erfplgen. Die fibereinstimmende Koordinaten 
werden als Koordinaten der DNA-Fragmente bewertet und gespei- 

15 chert. 

Das Scan- System mu£ reproduzierbar fiber mehrere Zyklen die 
Oberfiache abscannen konnen. X,Y und Z-Achsen-Einstellungen an 
jeder Oberf lachenposition kdnnen von einem Computer 
20 kontrolliert werden. Stabilitat und Reproduzierbarkeit der 
Einstellung von Objektivpositionen in jedem Scanvorgang 
entscheiden fiber die Qualitat der Detektion und somit fiber die 
Identifizierung der Signale einzelner Molekfile. 

25 a) Einstellung der Position des Objektivs (X,Y-Achse) 

* 

Die mechanische Instabilitat der kommerziell erhaltlichen Scan- 
tische und die geringe. Reproduzierbarkeit der wiederholten Ein- 
stellung derselben X, Y-Positionen machen eine prazise Analysen 

30 der Signale einzelner Molekfile fiber mehrere Zyklen schwierig. 
Es existieren viele M&glichkeiten, eine Ubereinstimmung der 
Koordinaten bei wiederholten Einstellungen zu verbessern bzw. 
mdgliche Abweichungen zu kontrollieren. Als Beispiel wird eine 
Kontrollmoglichkeit angeffihrt. Nach einer groben mechanischen 

35 Einstellung der Objektivposition wird ein Kontrollbild von 
einem mit der Oberfiache fest verbundenen Muster gemacht. Auch 
wenn die mechanische Einstellung nicht exakt dieselben 
Koordinaten aufweist (Abweichungen bis zu 10 pm sind durchaus 



WO 02/088382 



PCTYEP02/04659 



- 45 - 

moglich) , kann man mittels optischer Kontrolle eine Korrektur 
vornehmen. Das Kontrollbild vom Muster dient als 
Koordinatensystem ftir das Bild mit Signalen von eingebauten 
NTs*. Eine Voraussetzung fOr eine solche Korrektur ist, dass 
5 keine weiteren Bewegungen der Oberflache zwischen diesen beiden 
Aufnahmen gemacht werden. Signale von einzelnen Molektilen 
werden in Relation zum Muster gesetzt, so dass eine X,Y- 
Abweichung in der Musterposition gleiche X, Y-Abweichung in der 
Position der Signale einzelner Molekule bedeutet. Das 
10 Kontrollbild vom Muster kann vor, wahrend oder nach der 
Detektion einzelner Molekule gemacht werden. Ein solches Kon- 
trollbild mufi entsprechend bei jeder Einstellung auf einer 
neuen Oberf lachenposition gemacht werden. 

15 b) Einstellung der Fokusebene (Z-Achse) 

Die Oberflache ist nicht absolut plan und weist verschiedene 
Unebenheiten auf. Dadurch verandert sich der Oberf lache-Objek- 
tiv-Abstand beim abscannen benachbarter Stellen. Diese Unter- 
20 schiede im Abstand konnen dazu fuhren, dass einzelne Molekule 
die Fokusebene verlassen und so der Detektion entgehen. 

Aus diesem Grund ist es wichtig, dass beim Abscannen der Ober- 
flache eine reproduzierbare Einstellung der Fokusebene am jeder 
25 Objektivposition erreicht wird. 

Es gibt verschiedene Moglichkeiten, die Fokusebene reproduzier- 
bar einzustellen. Beispielsweise kann folgende Methode 
angewendet werden: Da die Anregung einzelner Molekttle zum 

30 AuslSschen ihrer Fluoreszenz ffihren kann, wird auf die 
Oberflache ein Marker aufgebracht, der zur Einstellung der 
Fokusebene dient. Danach erfolgt die Detektion der Signale 
einzelner Molekule. Der Marker kann beliebiger Natur sein (z.B. 
Farbstof f oder Muster) , darf aber die Detektion und die 

35 Reaktion nicht beeintrSchtigen. 



c) Detektion der Signale einzelner Molekttle, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF. 
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Das roit Hilfe des Detektionssystems erzeugte zweidimensionale 
Bild der Reaktionsoberf lache enth&lt die Signal informationen 
von in die NSKFs eingebauten NT's. Diese imissen vor der weiteren 
5 Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit 
geeigneten Methoden extrahiert werden. Die dazu notwendigen 
Algorithmen zur Skalierung, Transformation und Filtering der 
Bildinformationen zahlen zum Standardrepertoir der digitalen 
Bildverarbeitung und Mustererkennung (Haberacker P. "Praxis der 

10 Digitalen Bildverarbeitung und Mustererkennung" . Hanser-Verlag, 
Mttnchen, Wien, 1995; Galbiati L.J. "Machine vision and digital 
image processing fundamentals". Prentice Hall, Englewood 
Cliffs, New Jersey, 1990) . Die Signalextraktion erfolgt 
vorzugsweise iiber ein Grauwertbild, das die 

15 Helligkeitsverteilung der Reaktionsoberf lache fur den 
jeweiligen Fluoreszenzkanal abbildet. Wenn bei der 
Sequenzierungsreaiktion mehrere Nukleotide mit unterschiedlichen 
Fluoreszenz-Farbstof fen verwendet werden, kann zunachst fur 
jedes verwendete f luoreszenzmarkierte Nukleotid (A,T,C,G Oder 

20 U) ein separates Grauwert-Bild erzeugt werden. Dafttr konnen 
prinzipiell 2 Verfahren angewendet werden: 

1. Durch Verwendung von geeigneten Filtem (Zeiss-Filtersatze) 
wird fur jeden Fluoreszenzkanal ein Grauwertbild erzeugt. 

25 

2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe 
eines geeigneten Algorithmus durch ein 
Bildverarbeitungsprogramm die relevanten Farbkanale extrahiert 
und jeweils als Grauwertbild einzeln weiterverarbeitet . Zur 

30 Kanalextraktion wird dabei ein fiir den jeweiligen Kanal 
spezifischer Farb-Schwellwertalgorithmus eingesetzt. So 
entstehen zun&chst aus einem Mehrkanal-Farbbild einzelne 
Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt: 

35 GB N = (s(x,y)) einkanaliges Grauwertbild 

N={l, , . . , Anzahl der FluoreszenzkeuiSle} . 
M={0,1,...,255} Grauwertmenge 
S=(s(x,y)) Bildmatrix des Grauwertbildes 
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X=0 / 1 



t • • • / 



L-l 



Bildzeilen 
Bildspalten 

Ortskoordinaten eines Bildpunktes 
Grauwert des Bildpunktes. 



7=0,1, 
(x,y) 

s(x,y)€ M 



R-l 



Aus dieser Datenmenge wird nun durch ein geeignetes Programm 
die relevante Bildinformation extrahiert. Ein solches Programm 
sollte folgende Arbeitsschritte realisieren: 

10 Fur GBj bis GB„ durchfuhren: 

I. Vorverarbeitung dee Bildes, so zum Beispiel gegebenenfalls 
Reduktion des durch die Digitalisierung der Bildinformation 
entstandenen Bildrauschens, etwa durch Grauwertglattung. 



II. Prttfung jedes Bildpunkt (x # y) des Grauwertbildes, ob dieser 
Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und 
weiter entfernten Nachbarbildpunkten die Eigenschaften eines 
Fluoreszenzpunktes erfullt. Diese Eigenschaften hangen unter 

20 anderem von der verwendeten Detektionsapparatur und der 
Aufl6sung des Grauwertbildes ab. Sie konnen beispielsweise ein 
typisches Verteilungsmuster von Helligkeits-Intensitatswerten 
liber einer den Bildpunkt umgebenden Matrix darstellen. Die dazu 
verwendbaren Methoden der Bildsegmentierung reichen von 

25 einfachen Schwellwertverfahren bis hin zur Verwendung 
neuronaler Netze. 

Erfullt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein 
Vergleich mit den Koordinaten von in bisher durchgefxihrten 

30 Sequenzierungszyklen identif izierten NSKFs. Bei einer Ober- 
einstimmung erfolgt die Zuordnung des Signals mit dem aus dem 
jeweiligen Fluoreszenzkanal hervorgehenden Nxokleotid zu diesem 
NSKF. Signale mit nicht ubereinstimmenden Koordinaten werden 
als Hintergrundsignale bewertet und verworfen. Die Analyse der 

35 Signale kann parallel zum Scanvorgang erfolgen. 

In einer beispielhaften Ausfuhrung wurde ein 8-Bit-Grauwertbild 
mit einer Aufl6sung von 1317 x 1035 Pixel verwendet. Urn die 



15 
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durch die Digitalisierung entstandenen Veranderungen am Bild zu 
reduzieren, erfolgte zunachst eine Vorverarbeitung des Gesamt- 
bildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten 
seiner 8-Nachbarn zugewiesen. Bei der gewahlten Auflosung 
5 entsteht dadurch ein fttr einen Fluoreszenzpunkt typisches 
Muster eines zentralen Bildpunkt mit dem grofcten 
Helligkeitswert und Nachbarbildpunkten mit nach alien Seiten 
bin abfallenden Helligkeiten. Erfftllte ein Bildpunkt diese 
Kritierien und Oberschritt der zentrifugale Hell igkeitsabf all 
10 einen bestimmten Schwellenwert (zur Exklusion zu schwacher 
Fluoreszenzpunkte) , dann wurde dieser zentrale Bildpunkt als 
Koordinate eines Fluoreszenzpunktes gewertet. 

d) Verschiebung des Objektivs zur ncichsten Position auf der 
15 Oberflache. Nach der Detektion der Signale einzelner Molekule 
wird das Objektiv uber einer anderen Position der Oberflache 
positioniert • 

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der 
20 Kontrolle der X, Y-Position, der Einstellung der Fokusebene und 
mit der Detektion einzelner Molekule bei jeder neuen Objek- 
tivposition gemacht werden. Diese Schritte konnen durch einen 
Computer gesteuert werden. 

25 4.7 Zeitlicher Ablauf der Verfahrensschritte 

Der Scanvorgang sowie die biochemische Reaktion nehmen eine 
gewisse Zeit in Anspruch. Wenn man diese Vorgange nacheinander 
schaltet, kann mam eine optimale Leistung der Apparatur errei- 
30 chen. In einer bevorzugten Ausfuhrung wird die Reaktion auf 
zwei getrennten Oberf lichen durchgefiihrt (Fig. 9) . 

Als Beispiel kann eine Oberflache mit gebundenen NSKF-Primer- 
Komplexen in 2 r&umlich isolierte Teile getrennt werden, so 
35 dass Reaktionen auf diesen beiden Teilen unabhangig voneinander 
ablauf en kdnnen. In einem anderen Beispiel k6nnen NSKFs auch 
von vornherein auf 2 getrennten Oberfl&chen immobilisiert 
werden . 
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Danach wird die Reaktion gestartet. Das Prinzip dabei ist, dass 
wahrend auf einem Teil der Oberflache die Reaktions- und Wasch- 
schritte ablauf en, der zweite Teil abgescannt wird. Dadurch 
5 kann man einen kontinuierlichen Ablauf der Analyse erreichen 
und die Geschwindigkeit der Sequenzierung steigern. 

Die Anzahl der Oberfl&chen, auf denen die Reaktion ablauf t, 
kann auch gr6Ser als 2 sein. Das erscheint dann sinnvoll, wenn 

10 die Reaktion als zeitlich limitierender Schritt auftritt, d.h. 
die Detektion der Signale auf der Oberflache schneller als die 
Reaktions- und Waschschritte ablauf t. Urn die Gesamtdauer der 
Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne 
Schritt der Reaktion auf einer einzelnen Oberflache mit einer 

15 zeitlichen Verzogerung im Vergleich zur nachsten Oberflache 
ablauf en. 

Die Erfindung wird nachfolgend anhand von Beispielen verdeut- 
licht . 

20 

Beispiele 

Bejjspjel 1; 

25 

Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 7f- 
1) Als Ausgangssubstanzen dienen 5- (3-Aminoallyl) -2 ' - 
deoxyuridin- 5 ' - triphosphat , AA-dUTP, (Sigma) , 3,3' -Dithio- 
bis (propionsSure- N-Nydroxysuccinimidester) , DTBP-NHS, (Sigma) , 

30 2-Mercaptoethylamin, MEA, (Sigma) . Zu 100 pi 50mmol/l Ldsung 
von AA-dUTP in 100mmol/l Borat-Puffer pH 8.5 werden 3 Aquiva- 
lente an DTBP-NHS in DMF (25 pi 0.4mol/l Ldsung) zugegeben. Das 
Reaktionsgemisch wird 4 Stunden bei RT. inkubiert. AnschlieSend 
wird konz. Ammoniumacetat- Ldsung (pH 9) zugegeben bis die 

35 Gesamtkonzentration an CH 3 COONH 4 in der Reaktionsldsung 
100mmol/l ist, und die Reaktion wird eine weitere Stunde 
inkubiert. Danach werden zu diesem Gemisch 200 pi lmol/1 MEA*- 
Ldsung, pH 9, zugegeben und eine Stunde bei RT inkubiert. 
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AnschlieSend wird zu diesem Gemisch solange eine ges&tigte 
L6sung an I 2 in 0.3mol/l KI-L6sung zugetropft, bis die Iodfarbe 
bestehen bleibt. Die modif izierten Nukleotide werden auf einer 
DEAE-Cellulose-S&ule in Anunoniumcarbonat- Gradient (pH 8.5) von 
5 anderen Reaktionsprodukten abgetrennt. Isolierung des 
Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An 
diesen Linker konnen nun Farbstoffe mit verschiedenen Methoden 
gekoppelt werden ("Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 
10 Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method 
in Enzymology 1997, v. 278, S.363) . 

Auch andere Nukleotidanaloga (z.B. nach Hobbs et al. US Patent 
5,047,519, Khan et al. US Patent 5,821,356) konnen in die 
15 Reaktion eingesetzt werden, so dass Nukleotidanaloga mit 
Strukturen in Fig. 7f-2,3,4 und 7 g-1,2 erzeugt werden konnen. 

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird 
die Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat) 
20 angegeben (NT*-Struktur Fig. 7j) 

Das mit dem spaltbaren Linker modif izierte dNTP (300 nmol) wird 
in 30 yl 100mmol/l Natrium-Borat-Puf fer pH 9 aufgelost 
(10mmol/l NT*) . Dazu werden 10 pi 10mmol/l TRITC in 
25 Dimethyl formamid (DMF) gegeben und 4h bei RT inkubiert. Die 
Reinigung des mit dem Farbstoff modifizierten NT* erfolgt uber 
RP-HPLC in einem Methanol- Was ser Gradienten. 

Das so hergestellte NT* erfullt die Anforderungen des EinbauB 
30 in den DNA-Strang, des Fluoreszenznachweises und 
Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, 
die f\ir das Gelingen des erf indungsgemaSen Verfahrens 
notwendig sind. 

35 Beispiel der Spaltung der Disulf idverbindung im modifizierten 
NT*. Die Spaltung erfolgt durch Zugabe von 20 bis 50mmol/l 
Dithiothreitol-Ldsung (DTT) oder Mercaptoethanol-L&sung 
(Sigma), pH 8, auf die Reaktionsoberf l&che. Die Oberfl&che wird 



WO 02/088382 



PCT/EP02/04659 



- 51 - 

10 min. mit dieser Losung inkubiert, danach wird die L6sung 
entfernt und die Oberfl&che mit einer Puffer ldsung zur 
Entfernung von DTT- bzw. Mercaptoethanol-Resten gewaschen. 

5 

Beimel ?: 

Modifiziertes dUTP (dUTP-SS-CH 2 CH 2 NH 2 ) mit einem kurzen 
spaltbaren Linker (Fig. 7e-l) . Als Ausgangssubstanzen dienen: 
10 Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, 
v,180, S.383), 2 -Mercaptoethylamin (MEA) (Sigma). 

Zu 400 pi 100mmol/l Bis-dUTP in 40mmol/l Boratpuffer pH 8.5 
werden 100}j1 100mmol/l MEA- Ldsung pH 8.5 in H 2 0 zugegeben und 1 

15 Stunde bei RT inkubiert. Anschliefcend wird zu diesem Gemisch 
solange eine gesatigte Losung an I 2 in 0.3mol/l KI-L6sung zuge- 
tropft, bis die Iodfarbe bestehen bleibt. Die Nukleotide (Bis- 
dUTP und dUTP-SS-CH 2 CH2NH 2 ) konnen z.B. durch eine Ethanol- 
Prazipitation oder auf einer DEAE- Cellulose- Saule im 

20 Ammoniumcarbonat-Gradienten (pH 8.5) von anderen 
Reaktionsprodukten abgetrennt werden. Bis-dUTP stort bei der 
cuischliefienden Ankopplung eines Farbstoffs an die Aminogruppe 
des Linkers nicht, so dass die Abtrennung des dUTP-SS-CH 2 CH 2 NH 2 
von bis-dUTP im Endreinigungsschritt erfolgen kann. 

25 

In einer ahnlichen Weise kann auch dCTP (Fig.7-e2) modifiziert 
werden, dabei dient Bis-dCTP als Ausgangssubstanz 
(synthetisiert nach Hanna et al. Nucleic Acid Research 1993, 
v.21 r S.2073) . 

30 

An den Linker k6nnen nun Farbstoffe mit verschiedenen Methoden 
gekoppelt werden ("Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 
Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method 
35 in Enzymology 1997, v. 278, S.363) . 

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird 
die Ankopplung des FluoroLinkTM Cy3 monofunktional dye 
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(Amersham Pharmacia biotech) (NT*-Struktur Fig. 7i) angegeben. 
Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstof f . 
Die Reaktion wird nach Angaben des Herstellers durchgef iihrt : 
Dae mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird 
5 in 300 pi 100mmol/l Natrium-Borat- Puffer pH 8.5 aufgelost. Dazu 
wird Farbstoff (300nmol) gegeben und Ih bei RT inkubiert. Die 
Reinigung deB mit dem Farbstoff modif izierten NT* erfolgt uber 
RP-HPLC in einem Methanol -Wasser Gradienten. 

10 Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den 
Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5- 
isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC 
Fig . 7h) . 

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird 
15 in 30 yl 100mmol/l Natrium -Borat- Puffer pH 9 aufgelost (10mmol/l 
NT*) . Dazu werden 10 ]il 10mmol/l TRITC in DMF gegeben und 4h bei 
RT inkubiert. Die Reinigung des mit dem Farbstoff modif izierten 
NT* erfolgt uber RP-HPLC in einem Methanol -Wasser Gradienten. 

20 Das so hergestellte NT* erfullt die Anf orderungen des Einbaus 
in den DNA-Strang, des Fluoreszenznachweises und 
Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, 
die fur das Gelingen des erf indungsgem&Sen Verfahrens 
notwendig sind. 

25 

Beispiel der Spaltung der Disulf idverbindung im modif izierten 
NT*. Die Spaltung erfolgt durch Zugabe von 20 bis 50mmol/l 
Dithiothreitol-L6sung (DTT) oder Mercaptoethanol-Losung 
(Sigma), pH 8, auf die Reaktionsoberf lache. Die Oberfl&che 
30 wird 10 min. mit dieser Losung inkubiert, danach wird die 
Ldsung entfernt und die OberflSche mit einer Pufferl6sung zur 
Entfernung von DTT- bzw. Mercaptoethanol-Resten gewaschen. 

Weitere NT*s # wie z.B, in Fig. 7k, 11, 7m dargestellt, kdnnen 
35 ahnlich zu den in Beispielen 1 und 2 beschriebenen NT-Analoga 
synthetisiert und im Verfahren eingesetzt werden. Fur die 
einzelnen Synthesenschritte siehe beispielsweise J.L.Ruth et 
al. Molecular Pharmacology 1981 v. 20 S.415, L. 6tv6s et al. NAR 
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1987 v. 15 S.1763, G.E.Wright et al. Pbarmac Ther. 1990 v. 47, 
S.447, ^Nucleotide Analogs; Synthesis and Biological Function" 
K.H. Scheit 1980, Wiley-Interscience Publication, "Nucleic acid 
chemistry" Ed. L.B.Townsend, v. 1-4, Wiley- Interscience 
5 Publication, "Chemistry of Nucleosides and Nucleotides" Ed. 
L.B.Townsend, v. 1-3, Plenum Press. 



Beispiel 3: 

10 

Sequenzanalyse mit 4 markierten NTs* 

Bei einer bevorzugten Ausfuhrungsform der Erf indung werden alle 
vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
15 farbstoffen markiert. 

3A. Rekonstruktion der ursprunglichen Sequenzen nach dem 
Schrotschufc-Prinzip ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, 
20 Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 
v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, Miller et 
al. J.Comput.Biol. 1994 v.l S.257). (Dieses Prinzip ist 
insbesondere bei der Analyse neuer, unbekannter Sequenzen 
geeignet . ) 

25 

3A-lSequenzierung eines langen DNA-Stiicks (Fig.l) 

Im folgenden soil anhand der Sequenzierung eines 1Mb langen 
DNA-Sttickes schematisch die Sequenzierung langer 

30 Nukleins&ureketten dargestellt werden (Fig. 1) . Der 
Sequenzierung liegt das Shotgun- Prinzip zugrunde 
("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. 
Adams et al. Academic Press, Huang et al. Genom Res. 1999 
v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al. 

35 NAR 1995 v. 23 S.4992, Miller et al. J.Comput.Biol. 1994 v.l 
S.257). Das zu analysierende Material wird far die 
Sequenzierungsreaktion vorbereitet, indem es in Fragmente 
von vorzugsweise 50 bis 1000 bp L&nge zerlegt wird. Jedes 
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Fragment wird anschlieSend mit einer Primerbindungsstelle 
und einem Primer versehen. Dieses Gemisch aus verschiedenen 
DNA-Fragmenten wird nun auf einer planen Oberflache 
fixiert. Die nicht gebundenen DNA-Fragmente werden durch 
5 einen Waschschritt entfernt. Danach wird die 
Sequenzierungsreaktion an der gesamten Reaktionsoberf l&che 
durchgef tihrt . Zur Rekonstruktion einer 1 Mb langen DNA- 
Sequenz sollten die Sequenzen von NSKFs vorzugsweise ISnger 
als 300 NTs sein, durchschnittlich ca. 400 bp. Da pro 
10 Zyklus nur jeweils. ein markiertes NT* eingebaut wird, sind 
mindestens 400 Zyklen zur Sequenzierung notwendig. 

Insgesamt ist zur Rekonstruktion der ursprunglichen Sequenz 
die etwa 10- bis 100-fache Menge an Rohsequenzen erforder- 
15 lich, d.h. 10 bis 100 Mb. Bei einer durchschnittlichen 
Sequenzl&nge von ca. 400 bp pro NSKF benotigt man entspre- 
chend 25.000 bis 250.000 DNA-Fragmente, urn mehr als 99,995% 
der Gesamt sequenz abzudecken. 

20 Die ermittelten NSKF- Sequenzen stellen eine Population von 
(iberlappenden Teilsequenzen dar, die sich mit kommerziell 
erhaltlichen Programmen zur Gesamtsequenz der NSK zusammen- 
fugen lassen ("Automated DNA sequencing and analysis" S. 
231 ff. 1994 M. Adams et al. Academic Press , Huang et al. 

25 Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, 
Bonfield et al. NAR 1995 v. 23 S.4992, Miller et al. 
J.Comput.Biol. 1994 v.l S.257). 

3A-2Sequenzierung der Genprodukte am Beispiel der cDNA-Sequen- 
30 zierung 

In einer bevorzugten Aus ffthrungs form k6nnen statt einer 
Sequenz mehrere Sequenzen in einem Ansatz analysiert 
werden. Die ursprunglichen Sequenzen kdnnen aus den 
35 gewonnen Rohdaten z.B. nach dem SchrotschuS-Prinzip 
rekonstruiert werden. 

Zun&chst werden NSKFs erzeugt. Man kann z.B. mRNA in eine 
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doppelstrangige cDNA uberfflhren und diese cDNA mit Ul- 
traschall fragmentieren. AnschlieSend werden diese NSKFs 
mit einer Primerbindungsstelle versehen, denaturiert, 
inunobilisiert und mit einem Primer hybridisiert . Zu 
5 beachten ist bei dieser Variante der Probenvorbereitung, 
dass die cDNA-Molekule unvollstandige mRNA-Sequenzen 
darstellen kdnnen (Method in Enzymology 1999, v. 303, S.19 
und andere Artikel in diesem Band, "cDNA library protocols" 
1997 Humana Press) . 

10 

Eine andere Moglichkeit bei der Generierung 
einzelstrangiger NSKFs von mRNA besteht in der reversen 
Transkription der mRNA mit randomisierten Primern. Dabei 
werden viele relativ kurze antisense DNA- Fragment e gebildet 

15 (Zhang-J et al. Biochem.J. 1999 v. 337 S.231, Ledbetter et 

al. J.Biol.Chem. 1994 v. 269 S. 31544, Kolls et al. 
Anal . Biochem . 1993 v. 208 S.264, Decraene et al, 
Biotechniques 1999 v. 27 S.962). Diese Fragmente kdnnen 
anschlieSend mit einer Primerbindungstelle versehen werden 

20 (s.o) . Weitere Schritte entsprechen oben beschriebenen 

Vorgcbigen. Mit dieser Methode konnen komplette mRNA- 
Sequenzen (vom 5'- bis zum 3 1 -Ende) analysiert werden, da 
die randomisierten Primer ttber die gesamte Lange der mRNA 
binden . 

25 

Immobilisierte NSKFs werden mit einer der oben angeftihrten 
Ausfuhrungsformen der Secjuenzieimng analysiert. Da mRNA- 
Sequenzen wesentlich weniger repetitive Sequenzen aufweisen 
als z.B. genomische DNA, kann die Anzahl der detektierten 
30 Signale der eingebauten NTs* von einem NSKF geringer als 300 
sein und liegt vorzugsweise zwischen 20 und 1000. Die 
Anzahl der NSKFs, die analysiert werden nriissen, errechnet 
sich nach denselben Prinzipien wie bei einer Schrotschufi- 
Rekonstruktion einer langen Sequenz. 

35 

Aus NSKF-Sequenzen werden nach den Prinzipien des Schrot- 
schuS-Verfahrens die urspriinglichen Gensequenzen rekon- 
struiert . 
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Diese Methode erlaubt die gleichzeitige Sequenzierung von 
vielen mRNAs ohne vorherige Klonierung. 

5 3B. Analyse von Sequenzvarianten 

Die BestStigung einer bereits bekannten Seguenz oder der 
Nachweis von Varianten dieser Sequenz stellt sehr viel 
geringere Anspriiche an die Lange und Redundanz der 

10 ermittelten NSKF- Sequenzen. Auch die Sequenzbearbeitung ist 
in diesem Fall einfacher. Die Vollsequenz braucht nicht neu 
rekonstruiert zu werden. Die NSKF-Sequenzen werden vielmehr 
mit Hilfe eines kommerziell erh&ltlichen Progranims der 
Vollsequenz zugeordnet und eventuelle Abweichungen 

15 detektiert. Einem solchen Programm kann z.B. BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 
computational Biology" 1995 M.S. Waterman Chapman & Hall) . 

Die zu analysierende Sequenz wird mit einer der oben 
20 genannten Methoden in NSKFs uberftihrt. Diese NSKFs werden 
mit dem erf indungsgemafien Verfahren sequenziert, wobei man 
sowohl einen einheitlichen Primer und eine einheitlihe 
Primerbindungsstelle als auch unterschiedliche, 
sequenzspezifische Primer und nattirliche, in der zu 
25 untersuchenden Gesamt sequenz vorkommende 

Primerbindngsstellen, s. Beispiel 5, verwenden kann. 
AnschlieSend werden die ermittelten Sequenzen von NSKFs 
nicht nach dem SchrotschuS- Verfahren zusammengestzt, 
sondern mit der Referenzsequenz verglichen und auf diese 
30 Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei 
kann es sich urn genomische oder cDNA- Sequenzen handeln. 

Im Gegensatz zu einer Rekonstruktion nach dem Schrotschufi- 
Verfahren braucht man ftir die Analyse einer Sequenzvariante 
35 erheblich weniger Rohsequenzdaten. So kann die 5- bis 10- 
fache Rohsequenzmenge ausreichend fur die Wiederherstellung 
einer neuen Variante einer Vollsequenz sein. Mit dem 
SchrotschuB-Verfahren wird fOr eine Wiederherstellxmg eine 
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10- bis 100 -f ache Menge an Rohsequenzen ben6tigt 
("Automated DNA sequencing and analysis" S. 231 ff . 1994 m. 
Adams et al. Academic Press, Huang et al. Genom Res. 1999 
v.9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
NAR 1995 v.23 S.4992, Miller et al. J.Comput .Biol. 1994 v.l 
S.257) . 



Die LSnge der ermittelten NSKF- Sequenz en soil fur eine 
eindeutige Zuordnung zu einer bestimmten Position in der 

10 Referenzsequenz ausreichend sein, so konnen z.B bereits 
Sequenzen mit einer L&nge von 20 NTs (z.B. aus nicht 
repetitiven Abschnitten im menschlichen Genom) eindeutig 
identifiziert werden. Fflr die Vergleichsanalyse der repet- 
itiven Abschnitte werden langere Sequenzen bendtigt. Die 

15 genaue Lange der Sequenzen hangt dabei von der Aufgaben- 
stellung ab. Vorzugsweise betr&gt die Lange der ermittelten 
NSKF-Sequenzen bei der Analyse von nicht repetitiven 
Abschnitten mehr als 20 NTs. Fur die Analyse der 
repetitiven Abschnitte liegt sie vorzugsweise tiber 500 NTs. 

20 

Die Zielsetzungen bei der Sequenzierung neuer Varianten 
einer bereits bekannten Vollsequenz konnen sehr unter- 
schiedlich sein. Meist wird ein Vergleich der neu ermittel- 
ten Sequenz mit der bekannten Vollsequenz/Referenzsequenz 

25 angestrebt. Dabei k6nnen die beiden Sequenzen aus evolutio- 
nSr unterschiedlich weit auseinanderliegenden Spezies 
stammen. Verschiedene Parameter der Zusammensetzung dieser 
beiden Sequenzen konnen verglichen werden. Als Beispiele 
fxir eine solche Analyse dienen: Mutations- oder 

30 Polymorphismusanalysen und die Analyse von alternativ ge- 
spleiSten Genprodukten. 

Nachfolgend soil schematisch und beispielhaft ein Vergleich 
der zu untersuchenden Sequenz mit einer Referenzsequenz 
35 ohne vorherige Rekonstruktion der zu analysierenden Sequenz 
betrachtet werden. Ein solcher Vergleich kann z.B. zur 
Mutations- oder SNP-Analyse dienen. 
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» 

3B-1 

Eine lange, zu analysierende Sequenz, z.B. 1 Mb, wird in 
NSKFs mit einer der oben genannten Methode geteilt. Diese 
5 NSKFs werden unter Verwendung einheitlicher Primer mit dem 
erfindungsgemaSen Verfahren sequenziert. Die ermittelten 
Sequenzen von jedem einzelnen NSKF werden direkt mit der 
Referenzsequenz verglichen. Die Referenzsequenz dient dabei 
als Grundlage fxir die Zuordnung ermittelter NSKF -Sequenzen, 

10 so dass die aufwendige Rekonstruktion nach dem SchrotschuS- 
Verfahren entfailt. Vorzugsweise betr&gt die Lange der 
ermittelten NSKF- Sequenzen bei der Analyse von nicht- 
repetitiven Abschnitten mehr als 20 NTs . Fur die Analyse 
der repetitiven Abschnitte liegt sie vorzugsweise Ciber 500 

15 NTs. Die Anzahl der zu analysierenden NSKFs richtet sich 
dabei nach der Gesamtlange der zu untersuchenden Sequenz, 
der durchschnittlichen Lange der NSKF- Sequenzen und der 
notwendigen Genauigkeit der Sequenzierung, Bei einer durch- 
schnittlichen Lange der ermittelten NSKF-Sequenz von 100 

20 NTs, einer Gesamtlange der zu untersuchenden Sequenz von 1 
Mb und einer Genauigkeit, die der Rohsequenzermittlung 
entspricht (d.h. jede Stelle soil moglichst nur einmal 
sequenziert werden) benotigt man z.B. die ca. 5 -f ache Menge 
an Rohsequenzen, d.h. 5 Mb, weil die Verteilung der NSKFs 

25 tiber die Gesamtsequenz zufallig erfolgt. Insgesamt mussen 
50.000 NSKFs analysiert werden, urn mehr als 99% der 
Gesamtstrecke abzudecken. 

AnschlieSend werden die ermittelten NSKF- Sequenzen mit 
30 Hilfe eines kommerziell erhaitlichen Programms der 
Vollsequenz zugeordnet und eventuelle Abweichungen 
detektiert. Einem solchen Programm kann z.B. BLAST oder 
FASTA Algorithmus zugmnde liegen ("Introduction to 
computational Biology" 1995 M.S. Waterman Chapman & Hall). 
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Sequenzanalyse mit 2 niarkierten NTs* und 2 unmarkierten NTs 
(2NTs* / 2NTs-Methode) . 

5 

In einer anderen Ausffihrungsform werden fur die Analyse der 
Sequenzen 2 modif izierte NTs* und 2 unmodif izierte NTs einge- 
setzt . 

10 Diese Methode eignet sich besonders zur Analyse der Sequenzva- 
rianten (z.B. SNP- oder Mutationsanalyse) und setzt die 
Kenntnis einer Referenzsequenz voraus. Dabei wird die 
Vollsequenz nicht rekonstruiert , sondern die ermittelten 
Sequenzen werden mit Hilfe eines Programms der Referenzsequenz 

15 zugeordnet und eventuelle Abweichungen registriert. Einem 
solchen Programm kann z.B. der BLAST oder FASTA Algorithmus 
zugrunde liegen ("Introduction to computational Biology" 1995 
M.S. Waterman Chapman & Hall) . 

20 Diese Ausfuhrungsform beruht auf dem Prinzip, dass eine Abfolge 
aus 2 Signalen (markierte NT's) genugend Informationen zur 
Identif izierung einer Sequenz enthalten kann. Die ermittelte 
Sequenz wird mit der Referenzsequenz verglichen und einer 
bestimmten Position zugeordnet, z.B.; 

25 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC - Referenzsequenz 

30 

A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC (Referenzsequenz ) 

35 Die vinbekannte, zu smalysierende Variante der Referenzsequenz 
wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK 
wird in NSKFs OberfOhrt, diese werden mit PBS ligiert, 
anschlieSend rait einem Primer hybridisiert und auf 
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ReaktionsoberflSche . immobilisiert) . Auf diese Weise 
vorbereitete NSKFs werden mit 2NTs72NTs-Methode sequenziert. 
Man erhSlt NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge 
aus 2NTs* darstellt. Urn eine eindeutige Zuordnung der 
5 ermittelten Sequenz zu einer bekannten Referenzsequenz zu 
ermdglichen, muS diese Abfolge lang genug sein. Vorzugsweise 
betrSgt die Lange der ermittelten NSKF-Sequenzen mehr als 40 
NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, 
ist die Gesamtlange des synthetisierten komplementaren Strangs 
10 ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 
40 detektierten NTs* betragt die Gesamtlange z.B. 
durchschnittlich 80 NTs) . 

Zur Synthese eines komplementaren Stranges werden 4 Nukleotide 
15 benotigt. Da die mit einem Fluoreszenzfarbstof f markierten NTs* 
in der vorliegenden Erfindung als Semiterminatoren auftreten, 
d.h. die Termination ausschliefclich bei Verfugbarkeit modif i- 
zierter NTs* auftritt, mussen unmodif izierte NTs in einem zu- 
satzlichen Schritt in jedem Zyklus in die Reaktion zugegeben 
20 werden. Die genaue Position dieses Schrittes in dem Zyklus kann 
variieren. Wichtig dabei ist, dass die markierten NTs* und die 
unmodif izierte NTs getrennt verwendet werden. 

Ein Zyklus bei dieser Aus fuhrungs form kann beispielhaft folgen- 
25 dermafien aussehen: 

a) Zugabe einer L6svmg mit modif izierten NTs* und Polymerasen 
auf die Oberf l^che mit den bereitgestellten NSKFs 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
30 dieser Ldsung xinter Bedingxangen, die zur Verlangerung der 

komplementaren Strange urn ein NT geeignet sind 

c) Waschen 

d) Detektion der Signale von einzelnen, modif izierten und in 
die den NSKFs komplementaren neusynthetisierten Str&igen 

35 eingebauten NTs'-Molekdlen 

e) Entfernung der Markierung und der terminierenden Gruppe bei 
den eingebauten Nukleotiden 

f) Waschen 
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g) Zugabe von 2 unmodifizierten NTs und Polyraerasen 

h) Waschen. 

5 Diese 2NT*s/2NTs-Methode eignet sich beispielsweise fur die SNP- 
Analyse einer genomischen Strecke eines Gens oder fur doppel- 
strangige cDNA- Analyse . Ihr liegen folgende Prinzipien 
zugrunde : 

10 1) Die genet ische Information in jedem der beiden komplementa- 
ren DNA-Strange ist identisch, so dass fehlende 
Informationen in einem Strang durch die Information aus dem 
anderen Strang vervollstcindingt werden konnen. 

2) Durch bestimmte Paarkombinationen markierter NTs* kann man 
15 mit nur 2 NTs* die komplette Information aus einer doppel- 

strangigen DNA erhalten. Zul&ssige Kombinationen von NT*s 
bei dieser Aus fuhrungs form sind: A*C*; A*G* ; C*T*/C*U*; 
G*T*/G*U*. Bevorzugt wird die Kombination C* und U*. 

3) Als Grundlage der Analyse dient eine bereits bekannte Refe- 
20 renzsequenz. 

4) Die NSKFs stammen von beiden Strangen der zu analysierenden 
NSK und die ermittelten NSKF-Sequenzen decken die gesamte 
Lange der zu analysierenden Sequenz ab. 

25 Am folgenden Beispiel wird erklart, wie die Information aus 
einem doppelstrangigen DNA-Fragment mit nur 2 markierten NTs* 
gewonnen wird und wie die Unterschiede zur urspriinglichen oder 
nicht mutierten Sequenz (Ref erenzsequenz / Vergleichsequenz) 
festgestellt werden konnen. Sequenzen unter (1) und (2) sind 

30 bis auf eine Stelle identisch (unterstrichen) . A* und C* sind 
markiert . 

> 

1) zu priifende Sequenz: 

35 Die zu priifende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert, 
so dass eine Population an NSKF-Sequenzen (ermittelte NSKF- 
Sequenzen (n) ) entsteht. Diese ermittelten NSKF-Sequenzen 
enthalten Information von jedem Strang: 
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4 

5 ' A-£ C-AAA-A-C-A-C-CC3 ■ - ermittelte NSKP-Sequenz (i) , 

5 1 AT£QTTCGAAATATCGATCGCCTG3 1 
3 1 TASCAAGCTTTATAGCTAGCGGAC5 1 
5 3 ' A-CAA-C---A-A-C-A-C---C5 1 - ermittelte NSKF-Sequenz (i+1) 

2) Vergleichsequenz: 

Zur Analyse ist eine Vergleichsequenz (Ref erenzsequenz) 
10 erforderlich: 

5 1 ATTGTTCGAAATATCGATCGCCTG3 1 
3 ' TA.ACAAGCTTTATAGCTAGCGGAC5 1 

15 3) Vergleichsequenz rait angepaSten ermittelten NSKF-Sequenzen: 

Mit Hilfe eines Progratrans werden ermittelte NSKF-Sequenzen 
bestimmten Stellen in der Vergleichsequenz zugeordnet und 
eventuelle Abweichungen detektiert: 

20 

5 ' A-C C-AAA-A-C-A-C-CC3 1 - ermittelte NSKF-Sequenz (i) 

5 ' AITGTTCGAAATATCGATCGCCTG3 1 
3 1 TAACAAGCTTTATAGCTAGCGGAC5 ' 

3 ' A-CAA-C---A-A-C-A-C---C5' - ermittelte NSKF-Sequenz (i+1) 

25 ft 

(Einzelnukleotidmutation) 

Mit dieser Ausftihrungsform kann man eine doppelstrSngige 
Nukleinsfture auf SNP Oder Mutationen untersuchen. Dabei werden 

30 die ermittelten NSKF-Sequenzen mit einer Referenzsequenz 
verglichen. Die Grundregeln des Vergleichs einer Teilsequenz 
und einer kompletten Sequenz bei der Analyse mit nur 2 
markierten NTs unterscheiden sich nicht prinzipiell von denen, 
die bei dem Vergleich der Sequenzen anhand aller 4 markierten 

35 NTs* gelten. NSheres s. Sequenzvergleich bei Mutationsanalyse 
und SNP-Analyse mit 4NTs* (Beispiel 3B) . 
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Eine besondere AusfCUirungsform des Verfahrens stellt die 
Analyse von Einzelnukleotidpolymorphismen mit 

5 sequenzspezif ischen Primern dar. 

Zusatzlich zu Abschnitt 1 "Abkiirzungen und 

Begriffserl&uterungen" werden fur dieses Beispiel folgende 
Begriffe definiert: 

10 

Primer - Zur Verdeutlichung des erf inderischen Gedankens 
werden in diesem Beispiel folgende Begriffe unterschieden: 

a) Unter einem „Primer w wird vorliegend allgemein eine 
Population von Primermolektilen mit einheitlicher 

15 Struktur verstanden. 

b) „mehrere Primer " o.a. werden im Text als mehrere 
Populationen von Primermolekuleri verstanden, die 
unterschiedliche Struktur besitzen. 

c) Ein „Primer-Molekul w bedeutet ein einziges 
20 Oligonukleotid-Molekul. 

d) w Mehrere Primer-Molekule" bedeuten mehrere einzelne 
Oligonukleotid-Molekule; sie k6nnen einheitliche oder 
unterschiedliche Struktur aufweisen. 

* 

25 SNP-Stelle - eine Position in NSK, die auf Vorhandensein oder 
Abwesenheit von SNP untersucht wird. 

Zielsequenz - Teil einer Gesamtsequenz , der durch die 
Verwend\ing eines spezifischen Primers in der 

30 Sequenzierungsreaktion sequenziert/ bestimmt wird. Eine 
Gesamtsequenz kann mehrere Zielsecjuenzen enthalten. Eine 
Zielsequenz ist gemigend lang, urn eine Positionierung dieser 
Zielsequenz innerhalb der Gesamtsequenz mit grofcer 
Wahrscheinlichkeit zu gew&hrleisten. Zielsequenzen kSnnen 

35 beispielsweise eine oder mehrere SNP-Stellen enthalten. 



Erkennungssequenz - Teil der Zielsequenz, der fur die 
Zuordnung dieser Zielsequenz in der Gesamtsequenz verwendet 
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wird. 

In dieser Aus ftihrungs form zur SNP-Analyse werden mehrere 
potentielle SNP-Positionen in der Ref erenzsequenz ausgewahlt, 
5 die in einer zu analysierenden NSK untersucht werden. Zu 
diesen Positionen werden entsprechend unterschiedliche, 
sequenzspezif ische Primer bereitgestellt . Diese Primer kdnnen 
einen standardisierten Primersatz zur SNP-Analyse bei einer 
bestimmten Fragestellung bilden und einheitlich als Kit filr 
10 die betreffende Analysen eingesetzt werden. 

Die Vorbereitung des zu analysierenden Materials (auf SNP zu 
untersuchende einzel- und doppelstrangige Nukleinsaureketten) 
hat erf indungsgemSfc das Ziel, aus einer oder mehreren langen 
15 Nukleinsaureketten (Gei3amtsequenz) eine Population an relativ 
kleinen, zwischen 30 und 2000 NT langen, einzelstrangigen 
Nukleinsaurekettenf ragmenten (NSKFs) zu bilden. 

Diese NSKF-Molekxile werden zufallig auf einer planen 
20 OberflSche mit einer Dichte zwischen 10 und 1.000.000 pro 100 

/xm 2 -, vorzugsweise 10 und 100 NSKFs pro 100 pm 2 , 100 bis 10.000 

pro 100 /zm 2 oder 10.000 bis 1.000.000 pro 100/xm 2 immobilisiert . 

An die auf der Oberflache gebundenen NSKFs werden Primer 

hybridisiert , so dass die Dichte der ext ens ions fahigen NSKF- 
25 Primer -Komplexe ca. 10-100 pro 100/xm 2 betragt. Nach der 

Hybridisierung werden nicht gebundene Primer entfernt xind die 

Sequenzierungsreaktion gestartet. 

Durch eine Auswahl. der Zielsequenzen \md der 
30 sequenzspezif ischen Primer werden nur die relevanten 
Abschnitte der Gesamtsequenz untersucht, was die Menge nicht 
relevanter Informationen verringert und die Analysezeit 
verkiirzt . 

35 Dieser Aus fiihrungs form des Verfahrens zur SNP-Analyse liegen 
folgende Prinzipien zugrunde: 

* 

Es werden Stellen in einer Referenzsequenz ausgewShlt, die 
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m 

in den zu untersuchenden NSKs (Gesamtsequenz) auf 
Einzelnukleotidpolymorphismen (SNPs) uberpriift werden 
sollen. 

5 1) Zur Analyse jeder ausgewahlten SNP-Stelle werden 
spezifische Primer bereitgestellt, so dass jede zu 
untersuchende SNP-Stelle entweder die nSchste Position in 
3 -Richtung vom Primer einnimmt oder innerhalb von 2 bis 
100, vorzugsweise 2 bis 50, idealerweise 2 bis 20 

10 Positionen in 3 -Richtung vom Primer liegt. Die SNP- 

Stelle liegt somit innerhalb der Zielsequenz, die wahrend 
der Sequenzierungsreaktion bestimmt wird. Es werden 
vorzugsweise mehrere SNP-Stellen gleichzeitig analysiert, 
so dass mehrere spezifische Primer verwendet werden 

15 mussen. Die Primer werden vorzugsweise so ausgewShlt, 

dass sie mdglichst einheitliche Annealing- Tempera turen 
haben, d.h. Unterschiede zwischen Schmelztemperaturen 
einzelner Primerpopulationen liegen beispielsweise 
innerhalb eines Bereichs von ca. 4 Grad, besser innerhalb 

20 von 2 Grad, noch besser innerhalb von 1 Grad. 

2) Von der Gesamtsequenz werden kurze 
Nukleinsaurekettenfragmente (NSKFs) abgeleitet, wobei 
diese Fragmente einzelstrangig sind und eine Lange von 

25 20 bis 2000 NT, vorzugsweise 30 bis 500 NT besitzen. 

3) NSKF-Molektile werden in einer zufalligen Anordnung auf 
der Oberflache immobilisiert . 

30 4) Nach der Hybridisierung (Annealing) von 

sequenzspezif ischen Primern an die auf der Oberflache 
immobilisierten NSKFs wird eine zyklische 
Sequenzierungsreaktion durchgefuhrt , wobei fttr jedes an 
der Reaktion beteiligte NSKF-Molekul eine Zielsequenz 

35 ermittelt wird. Die Sequenzierungsreaktion l&uft an 

vielen Molekulen gleichzeitig ab. 



5) Die ermittelten Zielsequenzen enthalten Information uber 



WO 02/088382 



PCT/EP02/04659 



- 66 - 

die Zugehdrigkeit zu einem bestimmten Abschnitt in der 
Gesamtsequenz und fiber den SNP in diesem Abschnitt bei 
der zu untereuchenden Probe. Die Lange der Zielsequenzen 
und somit die Zahl der Zyklen ist so zu wfthlen, dass eine 
5 Identif izierung der Sequenzen gewahrleistet werden kann. 



In einer vorteilhaf ten Aus ffchrungs form werden die 
ermittelten Zielsequenzen mit der Ref erenzsequenz 

10 verglichen und durch Sequenztibereinstimmung zugeordnet. 

Bei einer gentlgend langen ermittelten Zielsequenz kann 
man sie mit grofier Wahrscheinlichkeit zu einer bestimmten 
Position in der Ref erenzsequenz zuordnen, Beispielsweise 
kann eine Sequenz aus 10 NTs mehr als 10* verschiedene 

15 Kombinationen bilden und somit mit einer groSen 

Wahrscheinlichkeit in einer NSK von nur 100.000 NT 
eindeutig identif iziert werden. Nach der Zuordnung der 
ermittelten Zielsequenz zur bestimmten Position innerhalb 
der Ref erenzsequenz werden Unterschiede in den Sequenzen, 

20 die SNPs, sichtbar. 

Zur Identifizierung der Zielsequenzen wird in einer 
anderen vorteilhaf ten Aus ftihrungs form sowohl die bereits 
bekannte Anzahl der Primer, ihre Zusammensetzung und ein 

25 bereits bekannter, an die Primerbindungss telle 

anschlieBender Sequenzabschnitt der Ref erenzsequenz 
verwendet. Dabei werden die ermittelten Zielsequenzen 
nach ihrer Zugehdrigkeit zu den Primern analysiert, wobei 
nur die nah an der Primerbindungsstelle liegenden 

30 Sequenzen berxicksichtigt werden nulssen. Wenn 

beispielsweise nur 1000 Primer verwendet werden, reichen 
weniger als 10 NTs der ermittelten Zielsequenzen, um eine 
Zuordnung zu den entsprechenden Primern zu ermdglichen. 

35 Die zu analysierende Probe enth&lt meistens mehrere identische 
GesamtsequenzmolekGle, z.B. mehrere Kopien von genomischer DNA 
aus Zellen eines Gewebes oder mehrere identische mRNA- 
Populationen aus Zellen eines Gewebes. 
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a) Wahl der SNP-S telle 

Mit der er f indungsgemSSen Methode kann man sowohl bekannte SNP- 
Stellen analysieren als auch neue SNP-Stellen ermitteln. Als 
5 potentielle SNP-Stelle kann jede Position in der NSK auftreten. 
Die Auswahl richtet sich nach der Fragestellung, z.B. SNP- 
Analyse in Genen, deren Produkte mit bestimmten Krankheiten 
assoziiert sind, oder SNP-Analyse in konservierten, kodierenden 
Abschnitten der Gene, die fur Membranrezeptoren kodieren, oder 
10 tiberprttfung bekannter SNP-Stellen in regulatorischen Sequenzen 
von Genen, die f\ir die Zellteilung wichtig sind. 

Eine zu analysierende SNP-Stelle liegt innerhalb einer 
Zielsequenz, die wahrend der Sequenzierungsreaktion bestimmt 

15 wird. Man kann mehrere SNP-Stellen innerhalb einer Zielsequenz 
ermitteln. Man kann andererseits auch mehrere Zielsequenzen 
z.B. innerhalb eines Gens wahlen. Wichtig dabei ist, dass die 
Zielsequenzen in genugendem Abstand voneinander in der 
Gesamtsequenz liegen. Dieser Abstand ist notwendig, damit nur 

20 ein sequenzspezifischer Primer pro NSKF hybridisiert, land er 
ist von der durchschnittlichen NSKF-Lange abhangig: je kurzer 
die NSKFs f desto naher aneinander k6nnen Zielsequenzen liegen. 
Die SNP-Stellen kdnnen bei angemessener Primer- Wahl an beiden 
Strangen einer doppelstrangigen Nukleinsaurekette analysiert 

25 werden. 

Das Verfahren bietet auch die Moglichkeit, beispielsweise 
mehrere SNP-Stellen aus vielen Individuen (als Stichprobe 
einer Population) gleichzeitig zu kontrollieren. Dadurch kann 
30 z.B. das SNP-Profil einer Population untersucht werden. 

b) Primer fur die Sequenzierungsreaktion 

Sequenzierungsreaktion an einem einzelnen NSKF-Molekiil wird 
durch ein Primer-Molekul ermSglicht. Ein sequenzspezifischer 
35 Primer ist erf indungsgemaS notwendig, urn die 
Sequenzierungsreaktion jeweils an einer bestimmten / 
spezifischen Zielsequenz innerhalb der Gesamtsequenz 
durchfflhren zu kSnnen. Der fttr die Analyse einer SNP-Stelle, 
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bzw. einer Zielsequenz einzusetzende sequenzspezif ische Primer 
stellt eine Population von Primer-Molektilen mit identischer 
Struktur dar. Fttr die Analyse mehrerer, unterschiedlicher 
Zielsequenzen sind mehrere unterschiedliche Primer- 
5 Populationen notwendig. 

Durch die Verwendung sequenzspezif ischer Primer werden nur die 
relevanten Sequenzabschnitte, die Zielsequenzen, analysiert. 
Im erf indungsgemafien Verfahren wird die zu sequenzierende 
10 LSnge der Sequenzen mdglichst niedrig gehalten, damit die 
Geschwindigkeit der Analyse steigt. 

Ein sequenzspezif ischer Primer bindet an eine ftir ihn 
spezifische Primerbindungsstelle in der zu analysierenden 

15 Sequenz, PBS. Die Zusammensetzung und die L&nge der Primer 
werden fur jede potentielle SNP-Stelle, bzw. Zielsequenz, 
optimiert. Beispiele far Optimierungsschritte sind in Rychlik 
et al. NAR 1990 v. 18 S.6409 dargestellt. Bei der Primerwahl 
bzw. bei der Wahl der PBS (Primerbindungsstelle) sind folgende 

20 Aspekte besonders zu berucksichtigen: 

1) Die zu analysierende SNP-Stelle sollte entweder gleich nach 
dem 3 ' -Ende des Primers oder innerhalb der nachsten 2 bis 50 
NTs, vorzugsweise 2 bis 20 NTs liegen . 

25 

2) Die Positionierung (die Wahl der Sequenzlange und der 
Zusammensetzung) der PBS zu SNP-Stelle sollte so erfolgen, 
dass die verschiedenen PBS -Sequenzen und die 
korrespondierenden Primer- Sequenzen moglichst Shnliche 

30 „Annealing- Temper at ur en u besitzen, um bei moglichst 
einheitlichen Hybrid! sierungsbedingungen zu binden. Das kann 
beispielsweise durch VerSnderung der PBS-Position im Bezug 
auf die . jeweilige, zu analysierende SNP-Stelle oder durch 
die Verftnderung der PrimersequenzlSnge erfolgen (Rychlik et 

35 al. NAR 1990 v. 18 S.6409). 

3) Der minimale Abstand zwischen Primern, die an denselben 
Strang in der Gesamtsequenz binden, sollte die 
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durchschnittliche NSKF-Lange nicht unterschreiten. 

Es konnen Primer fir beide Strange einer Doppelstrang-NSK 
verwendet werden. Damit lassen sich beispielsweise nah 
5 aneinander liegende SNP-Stellen erfassen, oder man kann eine 
Kontrolle einer SNP-Stelle in beiden strangen vornehmen. 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 10-30 Oder 30-40 oder 40-50. Ftir 
10 verschiedene SNP-Stellen, bzw. Zielsequenzen kfinnen Primer mit 
unterschiedlicher Lange eingesetzt werden. 

Piir die SNP-Analyse mit sequenzspezif ischen Primern werden 
Primer erf indungsgem&S in einer HybridisierungslSsung an die 
15 auf der Reaktionsoberf lache immobilisierten NSKFs hybridisiert 
(Annealing-Reaktion) . 

c) Immobilisierung von NSKFs 

In dieser AusfCtfirungform werden erf indungsgemaS die NSKF- 
20 Primer -Komplexe ausschliefclich uber die NSKFs an die 
Oberf lache gebunden (direkte Bindung von NSKFs an die 
Oberf lache) , wobei die bereitges tell ten NSKF-Molekdle an die 
plane Oberf l&che in zufalliger Anordnvmg gebunden werden. 

25 Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem 
der beiden Ketten-Enden (s.o.). Die Immobilisierung kann auch 
durch eine unspezif ische Bindung, wie z.B. durch Austrocknung 
der NSKFs enthaltenden Probe auf der planen Oberf lache 
erreicht werden. Die Dichte der Immobilisation kann zwischen 

30 10 und 100, 100 und 10.000, 10.000 und 1.000.000 NSKFs pro 100 
/an 2 liegen. 

d) Hybridisierung 

Die gebundenen NSKFs und die Primer werden unter stringenten 
35 Hybridisierungsbedingungen inkubiert, die eine m6glichst 
selektive Anbindung (Annealing) der Primer an die 
entsprechenden Primerbindungsstellen der NSKFs erlauben. 
Optimale Hybridisierungsbedingungen hangen von der genauen 



WO 02/088382 



PCT/EP02/04659 



- 70 - 

Struktur der Primerbindungsstellen und der jeweiligen 
Primers trukturen ab und lassen sich beispielsweise nach 
Rychlik et al. NAR 1990 v. 18 S.6409 berechnen. 

5 Die Primer stellen vprzugsweise ein Primergemisch dar. Die 
Konzentrationen einzelner sequenzspezif ischer Primer 
(Einzelkonzentrationen von Primer -Populationen) liegen 
beispielsweise zwischen 10pmol/l und lmmol/l f vorzugsweise 
zwischen O.ljxmol/1 land 10/imol/l. Die Gesamtkonzentration von 
10 Primern im Primergemisch liegt vorzugsweise zwischen lnmol/1 
und 10mmol/l. Das Verhaltnis zwischen einzelnen Primer - 
Populationen kann variieren. Primer k6nnen in deutlichem 
Uberschuss uber die immobilisierten NSKFs zugegeben werden, so 
dass die Hybridisierungszeit gering ist. 

15 

Die fur die Detektion notwendige Dichte von extensionsfahigen 
NSKF-Primer-Komplexen betragt ca. 10 bis 100 pro 100 jun 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer 
erreicht werden, 

20 

Bei einer bekannten NSKF-Konzentration konnen in einer 
Ausfuhrungsform die ImmobilisierxLngsbedingungen so gewahlt 
werden, dass die NSKFs in einer Dichte von ca. 10 bis 1000 
Molekule pro 100/xm 2 gebunden werden. NSKFs bestimmen somit die 
25 Dichte der NSKF-Primer-Komplexe. 

In einer anderen Ausfuhrungsform kann die Dichte der 
immobilisierten NSKFs wesentlich hoher als 1000 NSKFs pro 
lOO/an 2 liegen, z.B. 1.000.000 pro lOOjzm 2 . Die fur die optische 
30 Detektion notwendige Dichte der NSKF-Primer-Komplexe wird 
wahrend der Primer-Hybridisierung erreicht. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer) so 
zu wahlen, dass die Primer nur an einen Teil der 
immobilisierten NSKFs binden, s. Beispiel 6. 

35 

Bei unbekannter NSKF-Konzentration und entsprechend 
unbekannter Immobilisationsdichte kann die Hybridisierung 
(Annealing) von Primern an die NSKFs zu einer hoheren als 
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optimale Dichte von NSKF-Primer-Komplexen fflhren. 

Aus diesem Grund wird in einer vorteilhaf ten Aus fOhrungs form 
ein Teil der NSKFs enthaltenden Probe fCtr die Ermittlung der 
5 optimalen Dichte verwendet. Dieser Teil wird auf einer 
Reaktionsoberf l^che immobilisiert , die Primer werden an die 
NSKFs hybridisiert und die entstandenen NSKF-Primer-Komplexe 
werden durch den Einbau von Fluoreszenzfarbstof f tragenden 
NT*s (z.B. Cy3-dCTP, Amersham Pharmacia Biotech) markiert. Aus 

10 der ermittelten Dichte l&sst sich einerseits die eventuell 
notwendige Verdtinnung oder Konzentrierung der urspriinglichen 
Probe fur den endgtiltigen Sequenzierungsansatz errechnen (Die 
Hybridisierungsbedingungen werden beibehalten) . Andererseits 
kSnnen daraus notwendige VerSnderungen in den 

15 Hybridisierungsbedingungen errechnet werden, beispielsweise 
eine Verkttrzung der Hybridisierungszeit, wobei die NSKF- 
Immobilisiemngsdichte konstant bleibt. 

Das Mengen-Verhaltnis zwischen Primerpopulationen kann 
20 unterschiedlich oder gleich grofi sein, Durch eine hohere 
Primerkonzentrationen konnen gewisse, beispielsweise seltenere 
Sequenzen mit grofierer Wahrscheinlichkeit in einem bestimmten 
Zeitraum gebunden werden. 

25 Der groBe Vorteil der beschriebenen Verfahrensanordnung 
gegenuber einer Verf ahrensanordnung mit auf einer Oberflache 
immobilisierten sequenzspezif ischen Primern und einer 
anschliefienden Hybridisierung von Proben an diese Primer ist 
die deutliche Verkttrzung der Zeit fur die Hybrid! sierung 

30 (Annealing) zwischen den sequenzspezif ischen Primern und den 
zu analysierenden Proben auf der Reaktionsoberf l&che. 
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Beispiel 6; 

Die Vorbereitung und die Durchftihrung der 

S equenz i erungs r eakt ion 

5 

Die Vorbereitung der Gel-Oberfiache: 

Das Polyacrylamid-Gel far die Analyse von Reaktionen mit 
einzelnen Molekulen wird nach allgemeinen Regeln der Gel- 
10 Vorbereitung fttr elektrophoretische Auftrennung erstellt 
( Electrophoresis" A.T. Andrews, Oxford science publications 
1995) . 

Die Polymeri sat ions reakt ion kann z.B. durch UV-Licht oder 
15 durch Radikalbildner durchgefuhrt werden. In diesem Beispiel 

wird Ammoniumpersulfat (APS) und TEMED 

(Tetramethylethylendiamin) zur Radikalreaktion verwendet, z.B. 

TEMED 0.01% v/v und APS 0.04% w/v. Die 

Komponentenzusammensetzung kann breit variieren, die 
20 Konzentrationen einzelner Komponenten liegen in folgenden 

Bereichen (errechnet fur die gebrauchsfertige wassrige AA- 

bisAA-Losung) : 

Acrylamid-Monomer (AA) von 3 bis 30%, idealerweise zwischen 10 
25 und 20% Bis-Acrylamid (bis-AA) im Verhaltnis zum Acrylamid- 
Monomer 1:10 bis 1:50, vorzugsweise 1:20. 

Zur Herstellung werden 2 saubere Glasplatten verwendet (mit 
Aceton und danach Wasser gewaschen) . Eine Glasplatte (PI) wird 

30 vorzugsweise mit einem wasserabweisenden Reagenz* vorbehamdelt, 
z.B Repel-silan, Dimethyldichlorsilane-L6sung, Amersham 
Pharmacia-Biotech. P2 dient als fester Tr&ger fur das Gel und 
kann mit gelbindenden Reagenzien z.B. Bind-silan, 
Methacryloxypropyltrimethoxysilane , Amersham Pharmacia- 

35 Biotech, vorbehandelt werden, so dass es zu einer kovalenten 
Bindung zwischen dem Gel und der Glasoberf l&che kommt. Die P2- 
Vorbehandlung mit gelbindenden Reagentien ist dann sinnvoll, 
wenn mehrere Readctionen mit immobilisierten Molekiilen 
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durchgeftihrt werden mftssen. Bei einer geringeren Anzahl an 
Reaktionen ist eine solche Vorbehandlung nicht notwendig. In 
diesen Fallen reicht, f(ir P2 eine saubere Glas-Oberf lSche aus, 
so dass das Gel allein durch adh&sive KrSfte an der 
5 Glasoberfiache haften bleibt. 

Die fertige Polymer! sat ions ldsung ( AA/bi sAA- Losung mit 
Radikalbildnern) wird zwischen PI und P2 gegossen, so dass 
eine Schicht mit der Dicke von ca. 5 bis 30 /xm resultiert. Die 
10 Dicke des Gels kann z.B. durch Abstandhalter kontrolliert 
werden. Nach Erhartung wird PI entfernt. Das Gel bleibt auf P2 
haften. Es wird mit entionisiertem Wasser gewaschen. 

Das Gel kann direkt weiter verwendet werden oder in 
15 verschiedenen Fertigungsstadien getrocknet und gelagert 
werden. Vor einer Reaktion mit markierten Molekulen wird das 
Gel normalerweise einige Minuten in der Reaktions- Puffer losung 
aufgequollen und erst damn fUr die Reaktion eingesetzt. 

20 Auf eine so vorbereiteten Gel-Oberf lSche werden NSKFs durch 
das Austrocknen immobilisiert . 

Beispielsweise wurde eine Ldsung (ca. 1/xl) einer Plasmid-DNA 
25 (mit Hind III linearisierte, durch Hitze in einzelstrangige 
Form uberfuhrte pMOS-Blue-Plasmid-DNA ca. 3400 NT Icing, 
Konzentration 0.1jig//zl) auf ca. 10mm 2 der Gel-Oberf l&che 
aufgetropft und bei 90° C zum Trocknen gebracht. Die errechnete 
Dichte der immobilisiert en Plasmid-Molekttle betrug ca. 1000 
30 pro ljan 2 . 

Als Primer wurde das Oligonukleotid 5 ' - AGTGAATTCGAGCTCGGTAC- 3 ' 
verwendet. Die Primerbindungss telle (nachfolgend fettgedruckt) 
zusammen mit der fttr die Analyse relevanten Verlangerung hat 
35 folgende Sequenz: 

5' -ATCCCC2QGTACCGAGCTCGAATTCACT-3 ' 

Eine Flow-Cell (Mikrof lussigkeitskanal, MFK) , Fig. 6, mit der 
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Reaktionsoberf lache als Deckel wurde zusammengebaut . Ein 
solcher MFK erlaubt einen schnellen Flfissigkeitsaustausch 
unter der Geloberf l&che. 

5 Als Vorversuch wurde der Primer (errechnete Tm 45,3° C, 
O.l^mol/l in 50mmol/l Tris-HCl pH 8,7) bei 45° C far 10 Minuten 

■ 

mit der Plasmid-DNA auf der Oberfl&che hybridisiert 
(Annealing) . Nach einem Waschschritt wurde die Dichte der 
Plasmid-Primer-Komplexe kontrolliert . Die Kontrolle erfolgte 
10 durch den Einbau von dCTP-Cy3 (Amersham Pharmacia Biotech) 
unter Verwendung von Klenow- Fragment (2Units pro 50/il in 
20mmol/l Tris-HCl-Puffer, pH 8,5, mit 5mmol/l MgCl 2 , 15 Minuten 
bei 30° C) . Dabei wird nur ein einzelnes dCMP-Cy3 in den 
wachsenden Strang eingebaut. 

15 

Als Detektionsapparatur diente Axioplan 2e (Zeiss) mit der 
CCD-Kamera AxioCam (Zeiss), Fig. 8. 

Die Signaldichte der einzelnen, eingebauten dCMP-Cy3-Molekule 
20 entspricht der Dichte der ext ens ions f&higen Plasmid-Primer- 
Komplexe. Unter den genannten Bedingungen betrug die Dichte 
der Plasmid-Primer-Komplexe durchschnittlich ca. 15 pro 100 fim 2 
und lag damit in der gewQnschten GroSenordnung (Fig. 8a-c) . 
Auf einer zweiten, in gleicher Weise vorbereiteten Oberfl&che 
25 (mit Hind III linearisierte, durch Hitze in einzelstrangige 
Form iiberftihrte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang, 
Konzentration O.lfig/fil mit hybridisierten Primern) wird eine 
zyklische Sequenzierungsreaktion durchgef tthrt . Dabei werden 
dUTP-SS-CH 2 CH 2 NH-R-Cy3 (dUTP*) und dCTP-SS-CH 2 CH 2 NH-R-Cy3 
30 (dCTP*) (s. Beispiel 2) als reversible Terminatoren verwendet. 
Die Detektionsapparatur ist dieselbe wie im Vorversuch. 
Die fiir die zyklische Sequenzierungsreaktion verwendeten 
Ldsungen setzen sich wie folgt zusammen: 

35 a) Reaktionslosung f\ir die Einbaureaktion: 20 mmol/1 Tris-HCl- 
Puffer, pH 8.5, 5mmol/l MgCl 2 , 10% Glycerin, Klenow- 
Fragment (Amersham Pharmacia-Biotech) 2U pro 50/zl, dUTP* 
bzw. dCTP*, oder dATP und dGTP je 10 fimol/1. 
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b) Waschldsung: 20 mmol/1 Tris-HCl pH 8.5, 0.01% Na-Azid 

c) Reaktionslftsung fiir die Abspaltungsreaktion: 20 mmol/1 
5 Tris-HCl , pH 8.5, 50mtnol/l Mercaptoethanol . 

Die Einbaureaktionen mit markierten NT*s wurden bei 30°C fxir 15 
Minuten durchgef tihrt . 

10 Im ersten Zyklus der Sequenzierungsreaktion wurde eine 
Reaktionsldsung mit dCTP* zugegeben. Nach einem Waschschritt 
wurde ein Detektionsschritt durchgefuhrt, wobei Einzelmolekul- 
Signale mit den zugeordneten x,y-Koordinaten auf der 
Oberfl&che registriert wurden (insgesamt ca. 11.200 Signale) . 

15 Danach wurde die Markierung von den eingebauten NT*s 
abgespalten (Raumtemperatur, 10 Minuten) und die Oberflache 
gewaschen . 

Im zweiten Zyklus wurde eine Reaktionslosung mit dUTP* 
20 zugegeben und 15 Minuten lang bei 30° C inkubiert. Nach einem 
anschlie&enden Waschschritt wurden die Einzelmolekul-Signalen 
auf der Oberflache detektiert (insgesamt ca. 200 Signale) . 
Dies entspricht dem Hintergrundsignal, das durch eine 
unspezif ische Bindung der NT*s an die Oberflache entsteht. Die 
25 Markierung von den NT*s wurde abgespalten (Raumtemperatur, 10 
Minuten) und die Oberfl&che mit der Waschlosung gewaschen. 

Im dritten Zyklus wurde eine Reaktionslosung mit dATP und dGTP 
zugegeben und 15 Minuten lang bei 30° C inkubiert. AnschlieSend 
30 wurde die OberflSche gewaschen. 

Die Zyklen 1 bis 3 wurden drei mal wiederholt, wobei insgesamt 
ca. 9900 CCU-Zielsequenzen ermittelt wurden. Diese Sequenzen 
kdnnen eindeutig dem Primer zugeordnet werden. 

35 
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Lecxenden zu den Fiauren 1 bis 9 

Legende zu Fig. 1 

5 Schematische Darstellung der Sequenzierung einer langen 
Nukleinsaurekette 

Der Sequenzierung und der Rekonstruktion von langen 
Nukleins&uresequenzen (NSKs) liegt das Shotgun- Prinzip 
10 zugrunde. Die Sequenz eines langen DNA-Stticks wird dabei durch 
die Sequenzierung kleiner Fragmente (NSKFs) und eine 
nachfolgende RekonstruJction ermittelt. 

1) Ausgangsmaterial - die zu analysierende lange 
15 Nukleinsaurensequenz , Gesamt sequenz 

2) Fragmente von 50-1000 bp - die im Fragmentierungsschritt aus 
der Gesamt sequenz erzeugten NSKFs 

20 3) Fragmente mit jeweils einem Primer - NSKF-Primer-Komplexe 

4) Immobilisierte Fragmente - an die plane Oberflache gebundene 
NSKF-Primer-Komplexe, in dieser Aus fflhrungs form erfolgt die 
Bindung am 3 * -Ende der NSKFs 

25 

5) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenzierungsreaktion 

6) Waschschritt - nach dem Einbauschritt wird die Oberfl&che 
30 gewaschen 

7) Detektion - die Signale von einzelnen eingebauten NT*s 
werden detektiert 

35 8) Entfernung der Markierung und der zur Termination fuhrenden 
Gruppe - zur Fortsetzung der Sequenz ierungsreakt ion werden die 
Markierung und das sterische Hindernis entfernt 



WO 02/088382 



PCT/EP02/04659 



- 77 - 

Legende zur Fig. 2 

Beispiele fiir allgemeine Struktur vpn NSKF- Primer -Komplexen 

5 

Fig. 2a In dieser Ausftihrungsform wird eine einheitliche 
Primerbindungsstelle (PBS) an das 3"-Ende der NSKFs 
angekoppelt und an diese PBS bindet ein einheitlicher Primer. 

10 Fig. 2b In dieser Ausfuhrungsform werden natilrlich vorkommende 
Primerbindungsstellen verwendet, daher werden Gemische 
spezifischer Primer verwendet 

1) Primer 

2) Primerbindungsstelle 
15 3) NSKF 

Legende zur Fig. 3 

Ein Beispiel fur die Ankopplung einer einheitlichen 
20 Primerbindungsstelle (PBS) , die eine funktionelle Gruppe zur 
Bindung an die Oberflache tragt. 

In diesem Fall wird ein doppelstrangiger Oligonukleotidkomplex 
(3a) , der beispielsweise eine Modifikation an beiden StrSngen 
25 hat (3b) , an die doppelstrangigen NSKFs liegiert (3c) . Nach 
Denaturierung entstehen einzelstrSngige NSKFs mit 
einheitlicher PBS (3d) . 



30 Legende zur Fig, 4 

Ein anderes Beispiel fiir die Erzeugung einer einheitlichen 
Primerbindungsstelle (PBS) . 

35 In diesem Fall werden NTs an das 3'-Ende der einzelstr&ngigen 
NSKFs angekoppelt (ein so genanntes „Tailing") . Durch 
Verwendng eines einheitlichen NT entsteht eine einheitliche 
PBS. 
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Legende zur Fig. 5 

5 Beispiel fur die Bindung von NSKFs an eine gelartige 
Reaktionsober f lache • 

Auf einer festen Unterlage (1) haftet eine Gelschicht (2), 
z.B. ein Polyacrylamidgel (Fig. 5a), oder haften viele 
10 Gelkugelchen (5), z.B. Agarosekugelchen (Fig. 5b). An die 
Oberf lache des Gels sind NSKFs (4) gebunden. Die NSKFs tragen 
eine funktionelle Gruppe, z.B. Biotin, und sind an das Gel 
\iber Streptavidin oder Avidin (3) gebunden. 

15 

Legende zur Fig. 6 

Beispiel fur eine Durchf lussvorrichtung 

20 Eine gelartige Reaktionsoberf lache (1) ist auf einer ftir das 
Anregungs- und Fluoreszenzlicht durchlassige festen Unterlage 
(2) befestigt. Sie bilden zusammen den Deckel der Flow-Cell. 
Die Flussigkeiten in der Flow-Cell konnen kontrolliert 
ausgetauscht werden, wobei die Flow-Cell zusammen mit 

25 Vorratsbehalter (3), Pumpe (4) und Ventil (5) eine 
Durchf lussvorrichtung bilden. Auf der Reaktionsoberf l&che sind 
NSKF - Primer - Komplexe gebunden (hier nicht abgebildet) . Die 
Signale der eingebauten NT*s werden mit der 
Detekt ionsapparatur ( 6 ) detektiert . 

30 

Legende zur Fig. 7 

Strukturen von 2 '-Deoxynukleosidtriphosphaten, die im Verfahren 
eingesetzt werden k5nnen* 

35 

Fig. 7a - Schematische Darstellung der NT-Struktur, bei der 
die spaltbare Gruppe und die sterisch anspruchsvolle, zur 
Termination fuhrende Gruppe Teile des Linkers bilden. Der 
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Linker ist die Verbindung zwischen Nukleobase und 
Fluoreszenzf arbstof f . 

A,B,C,D,E - Linker, A - . der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
5 ftihrende Gruppe, F - Fluoreszenzf arbstof f . 

Fig. 7b - Schematische Darstellung der NT-Struktur # wobei die 
spaltbare Gruppe ein Teil des Linkers ist und der 
Fluoreszenzf arbstof f gleichzeitig die sterisch anspruchsvolle, 
10 zur Termination ftihrende Gruppe darstellt. 

A,B,C - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
fuhrende Gruppe, F - Fluoreszenzf arbstof f . 

15 Fig. 7c - Schematische Darstellung der Struktur von 
eingebauten NT*s nach dem Abspaltungsschritt . Dargestellt sind 
zwei NT*s mit dem verbliebenen Linkerrest (A) . 

Fig, 7d - Schematische Darstellung der NT-Struktur, wobei die 
20 spaltbare Gruppe, die gleichzeitig die sterisch 
anspruchsvolle, zur Termination ftihrende Gruppe ist, einen 
Teil des Linkers darstellt. 

A,B,C,D - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
25 fuhrende Gruppe, F - Fluoreszenzf arbstof f . 

Fig. 7e - Darstellung von bevorzugten NT-Strukturen, bei denen 
der Linker an die 5-Position im Pyrimidinring angekoppelt ist. 

30 Fig. 7f - Darstellung anderer bevorzugter NT-Strukturen, bei 
denen der Linker an die 5 -Position im Pyrimidinring 
angekoppelt ist. 

Fig. 7g - Darstellung von bevorzugten NT-Strukturen, bei denen 
35 der Linker an die 7 -Position im Purinring angekoppelt ist. 

Fig. 7h,±,j - Beispiele ffir die Ankopplung von Farbstoffen an 
den Linker 
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Pig. 7k 

Strukturen von weiteren 2'-Deoxynukleosidtriphosphaten, die im 
Verfahren eingesetzt werden konnen. Der Linker ist an die 5- 
5 Position des Pyrimidinrings gekoppelt. 

Die Substituenten 1^,3,3,4 sind wahlbar und kdnnen unabhangig 
voneinander auftreten. 

10 Die Z -Gruppe stellt in einer Ausftthrungsf orm (7k-l) die 
Verbindung. zwischen dem Linker und der Base dar. Sie ist 
wahlbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, 
Ether-, Thioether- oder Aminogruppe sein. 

15 Die E-Gruppe stellt in einer Ausfuhrungsform (7k-l) einen 
internen Teil des Linkers dar. In einer anderen 
Ausftihrungsform (7k- 2) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von 

20 Kohlenstof fatomen, vorzugsweise zwischen 1 und 5, sein. 

Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit 
einer internen Amid- Carbalcoxy- (Ester), Sulfoxy-, Ether-, 
Thioether- oder Aminobindung sein. 

25 Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare 
Gruppe. In den Ausfuhrungsformen (7k- 1,2) stellt sie einen 
internen Teil des Linkers dar. In einer anderen 
Ausftihrungsform (7k-3) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 

30 eine Ester-, Thioester- und Disulf idverbindung sein. 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wahlbar 
35 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mdgliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy- 
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(Ester), Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

Die X-Oruppe ist die Verbindung zwischen dem 
Pluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
5 sowohl vom Linker, als auch vom Fluoreszenzfarbstof f (F) 
abgeleitet werden kann. Sie ist w&hlbar und kann eine Amid-, 
Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

10 Fig. 7L 

Strukturen von weiteren 2'-Deoxynukleosidtriphosphaten, die im 
Verfahren eingesetzt werden konnen. Der Linker ist an die 7- 
Position des Purinrings gekoppelt. 

15 Die Substituenten 1^,2,3,4 sind wahlbar und kdnnen unabhSngig 
voneinander auftreten. 

Die Z -Gruppe stellt in einer Ausfuhrungsform (7L-1) die 
Verbindung zwischen dem Linker und der Base dar. Sie ist 
20 w&hlbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, 
Ether-, Thioether- Oder Aminogruppe sein. 

Die E-Gruppe stellt in einer Ausfuhrungsform (7L-1) einen 
internen Teil des Linkers dar. In einer anderen 

25 Ausftihrungsform (7L-2) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von 
Kohlenstof fatomen, vorzugsweise zwischen 1 und 5, sein. 
Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit 

30 einer internen Amid- Carbalcoxy- (Ester), Sulfoxy-, Ether-, 
Thioether- oder Aminobindung sein. 

Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare 
Gruppe. In den AusfQhrungsformen (7L-1,2) stellt sie einen 
35 internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (7L-3) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine Ester-, Thioester- und Disulf idverbindung sein. 
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Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wShlbar 
5 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere m5gliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy- 
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

10 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) 
abgeleitet werden kann. Sie ist w&hlbar und kann eine Amid-, 
15 Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

Fig, 7m 

Weitere Beispiele ftir Strukturen von 
20 2'-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt 
werden konnen. Der Linker ist an die 5 -Posit ion des 
Pyrimidinrings gekoppelt. 

Die Substituenten Ri, 2 , 3 ,4 sind w&hlbar und konnen unabhangig 
25 voneinander auftreten. 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstoff (F) herstellt, Diese Gruppe ist w&hlbar 
30 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mogliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy - 
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

35 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) 
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abgeleitet werden kann. Sie 1st w&hlbar und kann eine Amid-, 
Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

5 

Legende zur Pig. 8 

Beispiel fttr ein Detekt ions system 

10 Dargestellt ist ein Weitfeld-Optik-Detektiorissystem. Nach dem 
Einbau von markierten NT*s wird die Oberflache (7) abgescannt, 
wobei die Fluoreszenzsignale von einzelnen, an die NTs 
gekoppelten Farbstof fmolekiilen detektiert werden. 

15 Fig. 8a Schematische Darstellung eines Abschnittes der 
Reaktionsoberfl&che (grau) , der abgescannt wird. Die Kreise 
entsprechen jeweils der Aufnahrae eines 2D-Bildes und 
reprSsentieren die Flachen, von denen die Fluoreszenzsignale 
detektiert werden. Dabei werden pro Aufnahme mehrere Signale 

20 (beispielsweise 100 bis 10.000) von einzelnen Molekttlen 
gleichzeitig registriert. Die Reaktionsoberf lache wird in 
jedem Zyklus abgescannt, wobei wahrend des Scannvorganges 
mehrere Aufnahmen von unterschiedlichen Stellen der Oberfl&che 
gemacht werden. Dabei k6nnen bis zu mehreren Millionen Signale 

25 von eingebauten NT*s aufgenommen werden. Die hohe ParallelitSt 
ist die Grundlage fxir die Geschwindigkeit des Verfahrens. 

Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von 
einzelnen, eingebauten NT*s. Zur Versuchsbeschreibung siehe 
30 Beispiel 6. 

Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt 
Signale von vier eingebauten NT*s. Jedes Signal besitzt 
charakteristische Eigenschaf ten der Einzelmolekdlsignale (s. 
35 Beschreibung) und kann auf ginond dieser identif iziert werden 
(vorzugsweise mit Hilfe eines Computer -Programms) . Jedem der 
identif izierten Signale werden die entsprechenden X,Y- 
Koordinaten zugeordnet. 
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Legende zur Fig. 9 

5 Beispiel einer vorteilhaf ten Anordnung von 

Reakt ionsober f lichen . 

Der Durchsatz wird durch Verwendung von zwei getrennten Flow- 
Cells (MikroflussigkeitskanSle, MFK) erhoht. Wahrend in der 
10 einen Flow- Cell biochemische und chemische Reaktionen 
ablaufen, wird in der anderen die Detektion durchgef iihrt . 
AnschlieSend tauschen die Flow-Cells ihre Positionen. 
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Patentanspruche : 

1. Verfahren zur parallelen Sequenzanalyse von 
Nukleinsauresequenzen (Nukleinsaureketten, NSKs) , bei dem 
man 

Fragmente (NSKFs) einzelstrangiger NSKs mit einer Lange von 
etwa 50 bis 1000 Nukleotiden erzeugt, die tiberlappende 
Teilsequenzen einer Gesamtsequenz darstellen konnen, man 

die NSKFs unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlichen Primer in Form von NSKF- Primer - 
Komplexen auf einer Reaktionsoberf lache in einer zufalligen 
Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
durchfiihrt, indem man 

a) zu den auf der Oberflache gebundenen NSKF-Primer- 
Komplexen eine Ldsung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
(NTs") enthalt, die mit Fluoreszenzfarbstof fen markiert 
sind, wobei die bei gleichzeitiger Verwendung von 
mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstof fe so gewahlt sind, dass sich die 
verwendeten NTs* durch Messung unterschiedlicher Fluo- 
reszenzsignale voneinander unterscheiden lassen, wobei 
die NTs* strukturell an der Base so modifiziert sind, 
dass die Polymerase nach Einbau eines . solchen NT* in 
einen wachsenden komplementaren Strang nicht in der 
Lage ist f ein weiteres NT* in denselben Strang ein- 
zxibauen, wobei der Fluoreszenzfarbstof f abspaltbar ist 
und die strukturelle Modifikation ein abspaltbarer 
sterisch anspruchsvoller Ligand ist, man 

b) die in Stufe a) erhaltene station&re Phase unter 
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Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene station&re Phase unter 
Bedingungen w&scht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare Str&nge eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberfl&che bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo- 
reszenzfarbstoffe und die sterisch anspruchsvollen 
Liganden von den am komplementaren Strang angefttgten 
NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wSscht, die zur Entfernung der Fluo- 
reszenzfarbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf l^che und die Sequenz dieser 
NSKFs durch spezifische Zuordnung der in Stufe d) in auf- 
einanderfolgenden Zyklen an den jeweiligen Positionen 
detektierten Fluoreszenzsignale zu den NTs bestimmt. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man 
die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in jedem Zyklus nur jeweils ein 
markiertes NT* einsetzt. 
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3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man 
die Stufen a) bis f ) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in jedem Zyklus jeweils zwei unter- 
schiedlich markierte NTs* einsetzt. 

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man 
die Stufen a) bis f ) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in jedem Zyklus jeweils vier unter- 
schiedlich markierte NTs* einsetzt. 

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
NSKs Varianten einer bekannten Referenzsequenz sind und man 
die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils 
zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs 
einsetzt und man die Gesamtsequenzen durch Vergleich mit 
der Referenzsequenz ermittelt. 

6. Verfahren nach den Anspruchen 1 bis 5, dadurch gekenn- 
zeichnet, dass man in die NSKFs jeweils eine Primerbin- 
dungsstelle (PBS) einfuhrt, wobei man bei doppelstr&ngigen 
NSKs an beiden komplementaren Einzelstrangen jeweils eine 
PBS einfuhrt und wobei die Primerbindungsstellen fttr alle 
NSKFs jeweils gleiche oder verschiedene Sequenzen 
aufweisen. 

7. Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs mit Primern in einer Losung 
unter Bedingungen in Kontakt bringt, die zur Hybridisierung 
der Primer an die Primerbindungsstellen (PBSs) der NSKFs 
geeignet sind, wobei die Primer untereinander gleiche oder 
verschiedene Sequenzen aufweisen, und man die gebildeten 
NSKF- Primer -Komplexe anschlieSend auf der Reaktionsober- 
flSche bindet. 

8. Verfahren nach den AnsprGchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs zunachst auf der Reaktions- 
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oberfiache immobilisiert und erst anschliefiend mit Primern 
unter Bedingungen in Kontakt bringt, die zur Hybridisierung 
der Primer an die Primerbindungsstellen (PBSs) der NSKFs 
geeignet sind, wobei NSKF-Primer-Komplexe gebildet werden, 
wobei die Primer untereinander gleiche oder verschiedene 
Sequenzen aufweisen. 

9. Verfahren nach den Ansprtichen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der 
Reaktionsoberf lSche immobilisiert und erst anschliefiend mit 
NSKFs unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der NSKFs geeignet sind, wodurch NSKFs an die 
Ober f l&che gebunden und NSKF-Primer-Komplexe gebi lde t 
werden, wobei die Primer untereinander gleiche oder 
verschiedene Sequenzen aufweisen. 

10. Verfahren nach den Ansprtichen 1 bis 9, dadurch 
gekennzeichnet, dass die Dichte der extensions fahi gen NSKF- 
Primer-Komplexe zwischen etwa 10 und 100 pro 100/xm 3 liegt. 

11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
die NukleinsSuresequenzen (NSKs) Sequenzabschnitte einer 
Gesamtsequenz sind und die Primer sequenzspezif ische 
Primer sind, wobei man 

einzelstrangige NSKFs mit einer Lange von etwa 30 bis 1000 
Nukleotiden bereitstellt, die uberlappenden Teilsequenzen 
der Gesamtsequenz entsprechen, man 

die NSKF-Molekttle direkt an einer planen Oberfiache in 
einer zufalligen Anordnung bindet, man 

mit einer odfcr mehreren sequenzspezif ischen 
Primerpopulationen eine Hybridisierung (Annealing) an die 
immobilisierten NSKFs durchfxihrt, wobei die Dichte der 
einzelnen extensionsf&higen NSKF-Primer-Komplexe zwischen 
10 und 100 pro 100pm 2 liegt, man 
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eine zyklische Aufbaureaktion der zu NSKFs komplementaren 
Strange durchftihrt, indem man 

a) zu den gebundenen NSKF - Primer - Komplexen eine Losung 
zugibt, die eine oder mehrere Polymerasen und ein bis 
vier modifizierte Nukleotide (NTs*) enthait, die mit 
Pluoreszenzfarbstof fen markiert sind, wobei die bei 
gleichzeitiger Verwendung von mindestens zwei NTs* 
jeweils an den NTs* befindlichen Fluoreszenzfarbstof fe 
so gewahlt sind, daS sich die verwendeten NTs* durch 
Messung unterschiedlicher Fluoreszenzsignale 

voneinander unterscheiden lassen, und die NTs* 
strukturell so modifiziert sind, dass die Polymerase 
nach Einbau eines solchen NT* in einen wachsenden kom- 
plementaren Strang nicht in der Lage ist # ein wei teres 
NT* in denselben Strang einzubauen, wobei die zur 
Termination fuhrende Gruppe mit dem Fluoreszenzf arb- 
stoff abspaltbar ist, man 

die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Veriangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils um ein NT* verlangert 
werden, man 

die in Stufe b) erhaltenen stationaren Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare Strange eingebauten 
NT*-Molek\ile durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstof f charakteristischen Signals 
detektiert, wobei man gleichzeitig die relative Posi- 
tion der einzelnen Fluoreszenzsignale auf der 
Reaktionsoberf lache bestimmt, man 



b) 



c) 
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e) die zur Termination fiihrenden Gruppen mit den 
Fluoreszenzfarbstof fen von den am komplement&ren 
Strang angefiigten NTs* zur Erzeugung unmarkierter (NTs 
Oder) NSKFs abspaltet, man 

f) die in Stufe e) erhaltene station&re Phase unter 
Bedingungen w&scht, die zur Entfernung der zu 
Termination ftihrenden Gruppen mit den Fluoreszenz- 
farbstoffen geeignet sind, mem 

die Stufen a) bis f ) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf l&che und die Sequenz 
dieser NSKFs durch spezifische Zuordnung der in Stufe d) 
in aufeinanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs 
bestimmt . 

12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass 
man im Detektionsschritt (d) folgende Detektionsarten 
einsetzt : Weitf eld-Epif luoreszenzmikroskopie, Laser- 
Scanning-Fluoreszenzmikroskopie, TIRF-Mikroskopie . 

13. Verfahren nach Anspruch 11 oder 12, dadurch 
gekennzeichnet, dass die Konzentration einzelner 
sequenzspezif ischer Primer w&hrend der Hybridisierung 
(Annealing) zwischen 10pmol/l und l/xmol/l liegt. 

14. Verfahren nach Anspruch 11 oder 12, dadurch 
gekennzeichnet, dass die Konzentration einzelner 
sequenzspezif ischer Primer wahrend der Hybridisierung 
(Annealing) zwischen 1/xmol/l und lmmol/1 liegt. 

15. Verfahren nach den Anspruchen 11 bis 14, dadurch 
gekennzeichnet, dass es ein Verfahren zur SNP-Analyse ist 
und man einen sequenzspezif ischen Primer zur 
Identif izierung jeder SNP-Stelle in der Gesamtsequenz 
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verwendet . 

16. Verfahren nach Anspruch 15, dadurch gekeraizeichnet, dass 
die Zahl der parallel zu analysierenden SNP-Stellen grdSer 
als 2 ist und man fur jede SNP-Stelle einen 
sequenzspezif ischen Primer verwendet. 

17. Verfahren nach den Anspriichen 1 bis 16, dadurch gekenn- 
zeichnet, dass der zur strukturellen Modifikation 
verwendete sterisch anspruchsvolle Ligand der zur Markie- 
rung verwendete Fluoreszenzfarbstof f ist. 

18. Verfahren nach den Anspriichen 1 bis 17, dadurch gekenn- 
zeichnet, dass die Reaktionsoberf l&che aus der Gruppe 
bestehend aus Silicon, Glas, Keramik, Kunststof fen, Gelen 
ausgewcLhlt ist. 

19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass 
die Kunststoffe Polycarbonate oder Polystyrole oder 
Derivate derselben sind. 

20. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass 
die Gele Agarose- oder Polyacrylamidgele oder Derivate 
derselben sind. 

21. Verfahren nach Anspruch 20, dadurch gekennzeichnet, dass 
die Gele 1 bis 2 % Agarose-Gele oder 10 bis IS % 
Polyacrylamid-Gele sind. 

22. Verfahren nach den Anspruchen 1 bis 21, dadurch 
gekennzeichnet, dass die Polymerase eine DNA- Polymerase 
ohne 3 1 -5 1 -Endonukleaseaktivitat ist . 

23. Verfahren nach den Anspruchen 1 bis 21, dadurch 
gekennzeichnet, dass die Polymerase aus der Gruppe 
bestehend aus thermolabilen viralen, bakteriellen, 
eukaryontischen DNA-Polymerasen und thermos tabilen 
bakteriellen Polymerasen ausgew&hlt ist. 
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24. Verfahren nach Anspruch 23, dadurch gekennzeichnet, dass die 
DNA- Polymerase Sequenase Version 2, Klenow- Fragment der DNA- 
Polymerase I aus E.coli ohne 3» -5' exonukleatische 
Aktivitat, Polymerase Beta aus Saugetieren, Taq- Polymerase 
Oder ProHA-DNA- Polymerase ist. 

25. Verfahren nach den Anspriichen 1 bis 24, dadurch 
gekennzeichnet, dass die NTs* alpha -Phosphorothioat -NTs* 
sind land die Polymersase das Klenow- Fragment von E.coli- 
Polymerase I oder T4- DNA- Polymerase ist. 

26. Verfahren nach den Anspruchen 1 bis 25, dadurch 
gekennzeichnet, dass die Fluoreszenzf arbstof f e aus der 
Gruppe bestehend aus Cyanin-Farbstof f en, Rhodamine, 
Xanthene und deren Derivaten ausgew^hlt sind. 

27. Tr&ger zur Durchfilhrung des Verfahrens nach den Anspruchen 
11 bis 26, dadurch gekennzeichnet, dass auf seiner 
Oberflache die NSKFs in einer zuf&lligen Anordnung 
immobilisiert sind, wobei die Dichte der immobilisierten 
NSKF-Molektile zwischen 10 und 100 pro 100/*m 2 liegt. 

28. Tr^ger zur Durchfuhrung des Verfahrens nach den Anspruchen 
11 bis 26, dadurch gekennzeichnet, dass auf seiner 
Oberflache die NSKFs in einer zufalligen Anordnung 
immobilisiert sind, wobei die Dichte der immobilisierten 
NSKF-Molekule zwischen 100 und 1.000.000 pro 100/xm 2 liegt. 

29. Kit zur Durchftihrung des Verfahrens nach den Ansprttchen 1 
bis 26, dadurch gekennzeichnet, dass es eine Reaktionsober- 
f l&che (einen festen Tr&ger) , zur DurchfOhrung des Verfah- 
rens erforderliche Reaktionsldsungen, ein oder mehrere 
Polymerases und Nukleotide (NTs) enthalt, von denen ein 
bis vier mit Fluoreszenzfarbstof fen markiert sind, wobei 
die markierten NTs ferner strukturell so modifiziert sind 
(NT* bzw. NTs*) , dass die Polymerase nach Einbau eines sol- 
chen NT* in einen wachsenden komplementSren Strang nicht in 
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der Lage ist # ein weiteres NT* in denselben Strang 
einzubauen, wobei der Fluoreszenzfarbstof f abspaltbar ist 
und die strukturelle Modifikation ein abspaltbarer sterisch 
anspruchsvoller Ligand ist. 

30. Kit nach Anspruch 29, dadurch gekennzeichnet, dass der zur 
strukturellen Modifikation verwendete sterisch anspruchs- 
volle Ligand der zur Markierung verwendete Fluoreszenzfarb- 
stof f ist, 

31. Kit nach Anspruch 29 oder 30, dadurch gekennzeichnet, dass 
es ferner Bestandteile enthalt: 

a) zur Erzeugung von Einzelstrangen aus Doppelstr&ngen 
erforderliche Reagenzien, 

b) Nukleinsauremolekule, die als PBS in die NSKFs einge- 
fuhrt werden, 

c ) 01 igonukleot id- Primer , 

d) zur Abspaltung der Fluoreszenzfarbstof fe und sterisch 
anspruchsvollen Liganden erforderliche Reagenzien, 

und/oder 

e) Waschlosungen . 

32. Kit nach den Anspruchen 29 bis 31, dadurch gekennzeichnet, 
dass die Reaktionsoberf lache aus der Gruppe bestehend aus 
Silicon, Glas, Keramik, Kunststof f en, Gelen ausgew^hlt ist. 

33. Kit nach Anspruch 32, dadurch gekennzeichnet, dass die 
Kunststoffe Polycarbonate Oder Polystyrole Oder Derivate 
derselben sind. 

34. Kit nach Anspruch 32, dadurch gekennzeichnet, dass die Gele 
Agarose- oder Polyacrylamidgele oder Derivate derselben 
sind. 

35. Kit nach Anspruch 34, dadurch gekennzeichnet, dass die Gele 
1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamid-Gele 
sind. 



WO 02/088382 



94 



PCT/EP02/04659 



37. 



38. 



39. 



40. 



42. 



Kit nach den Ansprttchen 29 bis 35, dadurch gekennzeichnet, 
daS die Reaktionsoberf l&che ein Tr&ger nach den Ansprfichen 
27 und 28 ist. 

Kit nach den Ansprfichen 29 bis 36, dadurch gekennzeichnet, 
dass die DNA- Polymerase eine DNA- Polymerase ohne 3 1 -5 ' - 
Endonukleaseaktivit&t ist. 

Kit nach Anspruch 37, dadurch gekennzeichnet, dass die 
Polymerase aus der Gruppe bestehend aus thermolabilen 
viralen, bakteriellen, eukaryontischen DNA-Polymerasen und 
thermostabilen bakteriellen Polymerasen ausgew&hlt ist. 

Kit nach Anspruch 38, dadurch gekennzeichnet, dass die DNA- 
Polymerase Sequenase Version 2, Klenow- Fragment der DNA- 
Polymerase I aus E.coli ohne 3' -5» exonukleatische 
Aktivitat, Polymerase Beta aus Saugetieren, Taq- Polymerase 
oder ProHa-DNA-Polymerase ist. 

Kit nach den Anspruchen 29 bis 39, dadurch gekennzeichnet, 
dass die NTs* alpha-Phosphorothioat-NTs* sind und die 
Polymersase das Kl enow -Fragment von E.coli-Polymerase I 
oder T4 -DNA- Polymerase ist. 

Kit nach den Anspriichen 29 bis 40, dadurch gekennzeichnet, 
dass die Fluoreszenzfarbstof fe aus der Gruppe bestehend aus 
Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten 
ausgewahlt sind. 

NUkleotid der Formel. 
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43. Nukleotid der Formel 



7f-l) 



0 0 0 

o-U-o-P-o-ll-o 
6- 6- 6" 




Linker 



7f-2) 



ooo 

o-M-o-P-o-P-o 
6- 6- 6- 




WO 02/088382 



96 



PCT/EP02/04659 



7f-3) 





44. Nukleotid der Formel 
7g-D 
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7g-2) 




45. Nukleotid nach Anspruch 42 bis 44, dadurch gekennzeichnet, 
dass an die terminale Aminogruppe ein Fluoreszenzfarbstof f 
angeheftet ist. 



46. Nukleotid der Formel 
7h) 




Linker 
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47. Nukleotid der Formel 




48. Nukleotid der Formel 



7j) dNTP-SS-TRTTC (L 14) 




o 

^ ^ JL H , 

R^^^N^(CH 2 ) 2 -S-S-(CH 2 ) 2 -N^NH 

T 

^ V 

Linker 



R= dUTP 



49. Verwendung eines Nukleotids nach den Anspruchen 42 bis 48 
als NT* in einem Verfahren nach den Anspruchen 1 bis 26. 

50. Verwendung eines Nukleotids entsprechend Fig. 7k, 7L, 7m, 
als NT* in einem Verfahren nach den Anspruchen 1 bis 26. 
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Ausgangsmaterial 



2) 



Fragmente 50-1000 bp 



3) 



Fragmente mit jeweils 
einem Primer 



4) 




Immobilisierte Fragmente 



5) 



6) 





Zugabe einer LGsung mit 
Polymerasen und NTs* 



Waschschritt 



7) 



8) 



i 





Detektion 



Entfernung der Markierung und 
der zur Termination fiihrenden 
Gruppe 



Legende: 

feste OberQ&che 



Polymerase NT* Signal von NT* 




o 



* t 



• ■ # 



Mikroskop und 
Beleuchtung 
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iel fur allgemeine Struktur von NSKF-Primer-Komplexen 



Fig. 2 



2a) 



2 3 




1) Primer 

2) Primerbindungsstelle 

3) NSKF 
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Oligonukkotid-Konstruktion mit einer Primerbindungsstelle und blockierten 
Enden. 

3a) 

Oligonukleotidkomplex 5" 3" 

37/- -115- 

Primerbindungsstelle // // 

3b) 

Modifikation einer Seite des Oligonukleotides an beiden Strangen. Nur ein Ende steht 
fur die Ligation zur VerfUgung. 

xxxxx-5 s Y 

kkk-37/ //5 s 

Die modifizierenden Gruppen "xxxxx-" und "kkk-" konnen z.B. zur Immobilisation 
oder Markierung dienen. 



3c) 

Resultat der Ligation des Oligonukleotides mit den DNA-Fragmenten 

* kick 3// ' " Hy-Wk 



3d) 

Konstruktion der DNA-Fragmente nach der Denaturierung 
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Nukleotid- 



5" 3" einzelstrSngiges DNA-Fragment 

+ Deoxynucleotidyltransferase 
+ dGTP 

1 

5 (G ) n 3 
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Fig. 5 



Sa) 




//////////////////// 



5b) 




Legende: 

1) feste Oberflache 

2) Gel 

3) zur Immobilisation geeignete Gruppen, z.B. Avidin oder Streptavidin, oder 
Oligonukleotide 

4) NSKFs 

5) Agarosekugelchen 
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Flussrichtung 



Legende: 

1) ReaktionsoberflSche 

2) feste Unterlage 

3) Vorratsbehaiter 

4) Pumpe 

5) Ventil 

6) Objektiv des Mikroskops 
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Fig. 7 



7a) 



PPP— o 




7b) 




OH 



Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fiihrende Gruppe 
F - Fluoreszenzfarbstoff (Marker) 
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7c) eingebaute modifizierte NTs* nach der Spaltung 



Fig. 7 





Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination filhrende Gruppe 
F - Fluoreszenzfarbstoff (Marker) 



WO 02/088382 



PCT/EP02/04659 



9/19 



Fig. 7 
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Linker 
n = 2, 3,4 
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Linker 



n = 2, 3,4 
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Fig. 7 
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7g-D 



Fig. 7 
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Fig. 7 



dCTP 
dUTP 



Linker 




7j) dNTP-SS-TRTTC (L 14) 
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^ ^ X H , 
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^ v 

Linker 




R= dUTP 
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7k-1) 



7 k-2) 



7k-3) 




H,: R 2 ; R 3 : R 4 = -OCH 3 ; -CH 3 ; -OH ; -H ; -NHj ; -N0 2 ; -O-COAIkyl ; -Halogen 
Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 
C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 

E « -(CH 2 ) n1 - ; -(CH=CH-CH 2 ) n2 - ; -(CH 2 ) n3 -NH-CO-(CH 2 ) n4 - 

Y = -(CH 2 ) m - ; -(CH=CH-CH 2 ) n2 - ; -(CH^-NH-CO-fCH,),,,- ; 
n, ;n 2 ;n 3 ;n«=1 - 5 

F = Fluoreszenzfarbstoff 
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PPP— 0 




Base = A ; G 



Fig. 7 




R,; R 2 ; R 3 ; R« = -OCH 3 ; -CH 3 ; -OH ; -H ; -NH 2 ; -N0 2 ; -O-COAIkyl ; -Halogen 



Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 



C a -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 



E ■ -(CH 2 ) n1 - ; -(CHsCH-CH^- ; -(CH 2 ) n3 -NH-CO-(CH,) 1>4 - 



Y = 



*(CH 2 ) n1 - ; -(CH=CH-CH 2 ) n2 - ; -(CH^-NH-CO-fCHj),,,- ; 




n, ; ; n 3 ; n 4 = 1 - 5 



F = Fluoreszenzfarbstoff 
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7m-1) 



7m-2) 



7m-3) 




Fig. 7 



R,; Rj,; R 3 ; R 4 = -OCH, ; -CH, ; -OH ; -H ; -NH 2 ; -NO z ; -O-COAIkyl ; -Halogen 
Z; X = -NH- ; -S- ; -0- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 
C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 

E ; Y = -(CH 2 ) n) - ; -(CH^H-CH^- ; -(CH^-NH-CXMCH^- 
n, ; Oji rtj ; n 4 =1 -5 

F = Fluoreszenzf arbstoff 
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Fig. 8 



1 




Rechner 



I 



Legende: 



1) Lichtquelle zur Anregung der Fluoreszenz 

2) Lichtleitender Teil 

3) Scanntisch 

4) Vorrichtung zur Selektion von Spektren 

5) Detektionsvorrichtung 

6) Computer mit Steuerungs- und Analysefunktionen 

7) Oberflftche mit immobilisierten NSKFs 
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19/19 Fig. 9 

Sequenzierungsreaktion auf 2 getrennten Oberflachen. 

Wahrend eine Oberflache gescannt wird, werden auf der andem Oberflache alle anderen 
Zyklusschritte durchgefilhrt. 




Zyklusschritte Detektion 
a-f 
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SEQUENZPROTOKOLL 



<lio> Dmitri Tcherkassov 
<110> Prof .Dr. Walther Traut 
<110> Dr. Englbert Bauml 
<110> Christian Hennig 
<110> Norman Kock 

<120> Verfahren zur Analyse von Nukleinsaureketten 

<130> P060086 

<140> 
<141> 

<160> 9 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer (T 7 - 19 -Primer) 
<400> 1 

taatacgact cactatagg 19 

<210> 2 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primerbindungsstelle 
<400> 2 

attatgctga gtgatatcc 19 

<210> 3 
<211> 12 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 3 

accaaaacac cc 12 



<210> 4 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
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<400> 4 

atcatcgttc gaaatatcga tcgcctgatg cc 32 

<210> 5 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 5 

atcgttcgaa atatcgatcg cctg 24 

<210> 6 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 6 

attgttcgaa atatcgatcg cctg 24 



<210> 7 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 7 

tagcaagctt tatagctagc ggac 24 



<210> 8 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 8 

taacaagctt tatagctagc ggac 24 



<210> 9 
<211> 11 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 



<400> 9 
acaacaacac c 



11 
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